نرم افزار تشخيص گفتار از روي حركات لب توسط فارغالتحصيلان كارشناسي ارشد دانشگاه مهندسي پزشكي صنعتي اميركبير طراحي شد.
به گزارش فارس به نقل از روابط عمومي دانشگاه صنعتي اميركبير، مجري طرح، كاربرد سامانههاي لبخواني رايانهاي را در تشخيص فرامين ناتوانان گفتاري، تشخيص برخي كلمات خاص، مكملبازشناسي گفتار صوتي و همچنين كاربردهاي نظامي و اطلاعاتي و حفاظتي ذكر كرد.
رضاشالباف گفت: فرآيند بازشناسي تصويري گفتار شامل دو مرحله استخراج ويژگي از دنباله تصاوير لب و طبقهبندي ويژگيها به دست آمده است.
وي افزود: ويژگيهاي گفتاري تصوير حركات لب اين افراد كه داراي رنگ پوست و ظاهر متفاوتي بودند به كمك طراحي يك الگورتيم جديد استخراج شده و در مرحله بعد با استفاده از الگوريتم مدل مخفي ماركوف؛ حركات و گفتار تصويري تشخيص داده شد.
شالباف گفت: اين نرمافزار به معلوليني كمك ميكند كه دچار آسيب در سيستم صوتي بوده و قادر به برقراري ارتباط با ديگران نيستند اين افراد معمولا توانايي انجام صحيح حركات لب و شكلي كه براي تكلم لازم است را داشته ودر حالت ايدهال ميتوان با انجام لبخواني به مقصود آنها پي برد.
مجري طرح اضافه كرد: بهرهگيري از اطلاعات تصويري از شكلهاي لب و حركات آن، دقت و اطمينان سيستمهاي تشخيص اتوماتيك گفتار صوتي را خصوصا در محيطهاي نويزي به طور قابل توجهي بهبود ميدهد.
وي خاطر نشان كرد: دركاربرد حفاظتي ، اين سامانه ميتواند با بهرهگيري از حركات لب و بدون ثبت سيگنال صوتي، كلمات خاصي را شناسايي و تصوير گوينده آن را در مراكز عمومي و محلهاي تردد ثبت كند.
شالباف گفت: آزمايش اين نرمافزار بر روي مجموعه دادگان جمعآوري شده شامل 20 نفر زن و مرد بين سنين 20تا 50 سال صورت گرفته و روي 6 واژه گفتاري 1،2،3،4،5،6 با 91 درصد موفقيت، بازشناسي گفتار انجام شده است.