رئيس مجلسى الإدارة والتحرير
محمد الباز
رئيس مجلسى الإدارة والتحرير
محمد الباز

هل يستطيع الذكاء الاصطناعي التعرف على المشاعر عبر المقاطع الصوتية؟

الذكاء الاصطناعى
الذكاء الاصطناعى

أظهرت دراسة جديدة تمت مراجعتها من قبل خبراء، قدرة الذكاء الاصطناعي على اكتشاف المشاعر من الأداء البشري عبر مقاطع صوتية لا تزيد مدتها عن 1.5 ثانية.

كتب المؤلف الأول للدراسة هانز ديميرلينج، من معهد ماكس بلانك للتنمية البشرية: "يعمل الصوت البشري كقناة قوية للتعبير عن الحالات العاطفية، لأنه يوفر إشارات مفهومة عالميًا حول وضع المرسل ويمكن أن ينقلها عبر مسافات طويلة".

وخرجت الدراسة من مركز علم نفس مدى الحياة، بالتعاون مع باحثي علم النفس المقيمين في ألمانيا ليوني ستريسمان وتينا براون وتيمو فون أورتزن وبإشراف هانز ديميرلينج.

وتأتي البيانات الصوتية المستخدمة في هذا البحث من أكثر من 1500 مقطع صوتي فريد من قواعد بيانات المشاعر مفتوحة المصدر باللغتين الإنجليزية والألمانية، مصدرها قاعدة بيانات رايرسون الصوتية والمرئية للكلام والأغنية العاطفية، والتسجيلات الصوتية الألمانية مأخوذة من قاعدة بيانات برلين للكلام العاطفي. (ايمو-DB).

كيف يتعرف الذكاء الاصطناعي على مشاعر الإنسان

وكتب الباحثون: "إن التعرف العاطفي من التسجيلات الصوتية هو مجال يتطور سريعًا، وله آثار كبيرة على مستقبل الذكاء الاصطناعي والتفاعل بين الإنسان والحاسوب".

ولأغراض هذه الدراسة، قام الباحثون بتضييق الحالات العاطفية إلى ست فئات: الفرح، والخوف، والحيادية، والغضب، والحزن، والاشمئزاز.

و تم دمج التسجيلات الصوتية في مقاطع مدتها 1.5 ثانية وميزات متنوعة، تشمل الميزات الكمية تتبع درجة الصوت، وأحجام درجة الصوت، وعرض النطاق الترددي الطيفي، والحجم، والطور، وMFCC، والصفاء، والتونيتز، والتباين الطيفي، والتدحرج الطيفي، والتردد الأساسي، والنقطه الوسطى الطيفية، ومعدل التقاطع الصفري، ومربع متوسط ​​الجذر، وHPSS، والتسطيح الطيفي، وغير المعدل إشارة صوتية.