نشرت شركة آبل تقرير جديد على مدونتها الخاصّة بتعلّم الآلة والذكاء الصُنعي تطرّقت فيه لما يحدث خلف الكواليس عندما ينطق المستخدم جملة Hey Siri في هواتف iPhone وساعات آبل الذكية.
وقالت آبل إنها تلتقط ما ينطقه المستخدم بشكل دائم مع تجزئته لموجات صوتية صغيرة جدًا لا تتجاوز 0.01 ثانية، لتقوم بتمرير 20 موجة (نموذج)، أي ما يُعادل 0.2 ثانية، لخوارزميات تقوم بتحليل ما نطقه المستخدم وتُحاول استخراج نموذج صوتي له علاقة بجملة Hey Siri، وهذا للتأكّد من أن ما قاله المستخدم هو Hey Siri لتفعيل المساعد الرقمي، أو أنه مجرد حديث عابر لا علاقة للجهاز به.
ولتجنّب تفعيل سيري بشكل خاطئ، أو تجاهل طلب المستخدم، وضعت الشركة عتبة نقاط بحيث يتم تقييم الموجات الصوتية الواردة لمعرفة مدى قربها أو تشابهها مع نطق جملة Hey Siri، ففي حالة الحصول على تقييم يضعها بين العتبة الُعليا والسُفلى ينتظر النظام كلمات المستخدم من جديد بحساسية أعلى، لأنه يشك بوجود نيّة لتفعيل المساعد الرقمي إلا أن عوامل مثل الضجيج منعته من نطق الجملة بشكل واضح. أما لو حصلت الموجة على تقييم يتجاوز العتبة العُليا، فالتفعيل يتم بشكل فوري.
وذكرت آبل كيف يتم تفعيل سيري في ساعات آبل، ففي هواتف iPhone هناك مُعالج خاص بسيري يمنع استهلاك طاقة الجهاز. لكن وفي ساعات آبل يحتاج المستخدم لتشغيل الشاشة أولًا قبل نطق الجملة. وفي هذا الصدد قالت آبل إن المُستشعرات ترصد رفع المرفق ليقوم نظام watchOS بتنفيذ بعض الأوامر مثل تشغيل الشاشة وتشغيل المايكروفون لانتظار جملة Hey Siri، وتلك أمور لا تحتاج أكثر من 5٪ فقط من قوّة المعالجة.
أخيرًا، وعن سبب اختيار جملة Hey Siri، قالت آبل إنها رصدت الكثير من المستخدمين يقولون Hey Siri قبل طرح السؤال، وهذا عند تفعيلها عن طريق الضغط على الزر الرئيس Home، الأمر الذي جعلهم يعتمدون تلك الجملة. وأضافت أنهم قاموا بدراسات لغوية لآلية نطق جملة التفعيل خصوصًا أنها تتشابه مع نطق كلمات مثل “جدّي” Serious أو “سوريا” Syria.
via عالم آبل http://ift.tt/2gstjNU
0 التعليقات:
إرسال تعليق