הסיבה לכך שאפליקציות יכולות לזהות שירים תוך שניות ספורות.

אנשים רבים כבר השתמשו באפליקציות המסוגלות לזהות שירים רק על ידי האזנה לכמה שניות של אודיו. פשוט פתחו את האפליקציה, קרבו את הטלפון שלכם למקור הצליל, ובתוך זמן קצר, שם השיר והאמן מופיעים על המסך. טכנולוגיה זו נראית כמעט קסומה, אך במציאות, היא כוללת סט מתוחכם של טכניקות ניתוח אודיו והשוואת נתונים.

יישומים אלה משתמשים באלגוריתמים מיוחדים המנתחים מאפיינים ייחודיים הקיימים בכל שיר. על ידי השוואת מאפיינים אלה עם מאגרי מידע גדולים של מוזיקה, המערכת יכולה לזהות במהירות איזה רצועה מתנגנת.

לכידת אודיו באמצעות מיקרופון

התהליך מתחיל כאשר האפליקציה מפעילה את המיקרופון של הטלפון.

המכשיר לוכד כמה שניות מהשמע המתנגן בסביבה. אין צורך להקליט את השיר כולו; בדרך כלל מספר שניות מספיקות כדי שהמערכת תבצע את הזיהוי.

נתוני הקול הללו נשלחים לאחר מכן לעיבוד.

המרת קול לנתונים דיגיטליים

לאחר לכידת השמע, האפליקציה ממירה את הצליל לנתונים דיגיטליים.

גלי קול הופכים לאותות מספריים שניתן לנתח באמצעות אלגוריתמים. תהליך זה מאפשר למערכת לבחון פרטי שמע בדיוק רב.

שלב זה חיוני כדי שהתוכנה תוכל לפרש את הצליל.

ניתוח מאפייני שמע

לאחר מכן, המערכת מנתחת את המאפיינים הייחודיים של המוזיקה.

פרסומות

אלמנטים כגון תדירות, עוצמה ותבניות קצביות נבחנים. לכל יצירה מוזיקלית יש שילוב מסוים של אלמנטים אלה.

מאפיינים אלה יוצרים מעין חתימה קולית.

יצירת "טביעת אצבע" של המוזיקה

בהתבסס על המאפיינים שזוהו, האלגוריתם יוצר מה שנקרא טביעת אצבע שמעית.

טביעת אצבע דיגיטלית זו היא ייצוג קומפקטי של החלקים הבולטים ביותר במוזיקה. היא אינה מכילה את האודיו המלא, אלא תבניות המאפשרות זיהוי הרצועה.

שיטה זו הופכת את ההשוואה למהירה הרבה יותר.

השוואה עם מאגר נתונים של מוזיקה

לאחר יצירת טביעת האצבע, היא מושוותה למסד נתונים ענק.

מאגרי מידע אלה מכילים טביעות אצבע דיגיטליות של מיליוני שירים. המערכת מחפשת דפוסים דומים בין האודיו שנקלט לבין ההקלטות המאוחסנות.

כאשר נמצאת התאמה חזקה, מזוהה המוזיקה.

שימוש באלגוריתמי התאמה מהירים

האלגוריתמים שבהם נעשה שימוש נועדו לבצע השוואות מהירות ביותר.

אפילו עם מסדי נתונים ענקיים, המערכת יכולה למצוא התאמות תוך שניות ספורות.

זה מושג באמצעות טכניקות אינדוקס וחיפוש אופטימלי.

עמידות בפני רעשי סביבה

אחד האתגרים הגדולים ביותר הוא זיהוי מוזיקה בסביבות רועשות.

האלגוריתמים מאומנים להתעלם מרעשי רקע ולהתמקד בחלקים האופייניים ביותר של המוזיקה.

זה מאפשר למערכת לתפקד גם במקומות עמוסים.

זיהוי עם כמה שניות בלבד של שמע.

טביעת אצבעות שמע יעילה ביותר.

אפילו עם הקלטה של כמה שניות בלבד, המערכת מסוגלת ללכוד מספיק מידע כדי לזהות את השיר.

זה מסביר מדוע אפליקציות מסוגלות לזהות שירים כל כך מהר.

עיבוד בשרתים מרוחקים

חלק ניכר מהעיבוד מתבצע בשרתים בענן.

הטלפון הסלולרי שולח את טביעת האצבע לשרתים הללו, אשר משווים אותה לאחר מכן למסד הנתונים של המוזיקה.

עיבוד מרחוק זה מאפשר טיפול בכמויות גדולות של מידע.

עדכון מתמיד של מסד הנתונים

מסדי הנתונים בהם משתמשים יישומים אלה מתעדכנים באופן קבוע.

שירים חדשים מתווספים כל הזמן כדי להבטיח שהמערכת תוכל לזהות שירים מהדורות אחרונות.

עדכון מתמיד זה מרחיב את יכולות הזיהוי.

זיהוי גרסאות שונות של שיר.

אלגוריתמים מודרניים מסוגלים לזהות גרסאות שונות של אותו שיר.

זה כולל הקלטות חיות, רמיקסים או שינויים קלים באיכות האודיו.

המערכת מנתחת דפוסים יסודיים במוזיקה שנותרים עקביים.

למידה עם בינה מלאכותית

גם בינה מלאכותית תורמת לשיפור הדיוק.

מודלים של למידת מכונה עוזרים לזהות דפוסים מורכבים באודיו ולשפר שיטות השוואה.

עם הזמן, המערכת הופכת ליעילה יותר.

מהירות חיבור האינטרנט

מהירות הזיהוי תלויה גם בחיבור האינטרנט.

חיבור מהיר מאפשר לך לשלוח נתונים לשרתים ולקבל תגובה כמעט באופן מיידי.

זה תורם לתחושת ההכרה המיידית.

אופטימיזציה עבור מכשירים ניידים

האפליקציות נועדו לעבוד היטב על סמארטפונים.

חלק מהעיבוד הראשוני מתבצע ישירות במכשיר כדי להפחית את כמות הנתונים הנשלחת לשרתים.

אופטימיזציה זו מאיצה את התהליך.

זיהוי אפילו עם אודיו באיכות נמוכה.

אפילו כאשר מוזיקה נקלטת באיכות נמוכה יותר, המערכת יכולה לזהות דפוסים חשובים.

האלגוריתמים מתמקדים בתדרים ספציפיים שנשארים ניתנים לזיהוי גם עם עיוותים.

זה מגדיל את שיעור ההצלחה.

שימוש בהקשרים שונים

טכנולוגיה זו יכולה לזהות שירים המתנגנים ברדיו, בטלוויזיות, בברים או במהלך הופעות חיות.

כל עוד האודיו המוקלט מכיל מספיק דפוסים של המוזיקה המקורית, המערכת מסוגלת לבצע את הזיהוי.

זה הופך את התכונה לרב-תכליתית ביותר.

אינטגרציה עם פלטפורמות מוזיקה

לאחר זיהוי השיר, אפליקציות רבות מציעות אפשרויות נוספות.

המשתמש יכול להאזין לרצועה המלאה, להוסיף אותה לספרייה שלו או לגשת למידע על האמן.

שילוב זה מרחיב את התועלת של הטכנולוגיה.

אבולוציה של זיהוי מוזיקלי

טכנולוגיות זיהוי מוזיקלי מוקדמות היו מוגבלות הרבה יותר.

עם ההתקדמות בעיבוד נתונים ובינה מלאכותית, מערכות הפכו למהירות ומדויקות הרבה יותר.

כיום, ניתן לזהות מיליוני שירים תוך שניות ספורות בלבד.

המדע שמאחורי זיהוי מוזיקלי.

היכולת לזהות שירים במהירות היא תוצאה של שילוב של ניתוח אודיו, אלגוריתמים יעילים ומסדי נתונים גדולים של מוזיקה. על ידי הפיכת צליל לטביעת אצבע ייחודית והשוואתו למיליוני רשומות מאוחסנות, אפליקציות יכולות למצוא התאמות כמעט באופן מיידי. תהליך זה הופך כמה שניות של אודיו שנלכד על ידי טלפון נייד לחיפוש מדויק ביותר, המאפשר לכל אחד לגלות את שם השיר תוך רגעים, אפילו בסביבות רועשות.

מאמרים קשורים

קָשׁוּר