ساختن یک دستیار صوتی سفارشی با گیج کننده


نویسنده (ها): krishnamurthy deepak krishnamurthy

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

به فراتر از سیری ، دستیار گوگل و الکس نگاه می کنم

دستیار گوگل ، الکسا و سیری دستیاران صوتی مسلط هستند که برای استفاده روزمره در دسترس هستند. این دستیاران تقریباً در هر خانه ای همه گیر شده اند و وظایفی را از اتوماسیون منزل ، یادداشت برداری ، راهنمایی دستور العمل ها و پاسخ دادن به سؤالات ساده انجام می دهند. هرچند که در سن پاسخ به سؤالات می آید ، در عصر LLMS، دریافت یک پاسخ مختصر و مبتنی بر زمینه از این دستیاران صوتی ، اگر وجود نداشته باشد ، می تواند مشکل باشد. به عنوان مثال اگر از Google Assistant سؤال می کنید که چگونه بازار در 22 اوت به سخنرانی جروم پاول در جکسون هول واکنش نشان می دهد ، به سادگی پاسخ می دهد که جواب را نمی داند و چند پیوندی را ارائه می دهد که می توانید از آن استفاده کنید. این در صورتی است که شما دستیار Google مبتنی بر صفحه را دارید.

ساختن یک دستیار صوتی سفارشی با گیج کننده

عکس توسط جیمز یارمما در بی تظاهر کردن

در این مقاله ، کاستی های دستیاران صوتی موجود مانند Google Assistant ، Alexa و Siri ، به ویژه در ارائه پاسخ های مختصر و مبتنی بر متن ، مورد بحث قرار می گیرد. این تجربه و انگیزه نویسنده را برای ایجاد یک دستیار صوتی سفارشی با استفاده از گیج کننده و تمشک PI مستند می کند. نویسنده با ادغام مؤلفه های مختلف سخت افزار و نرم افزاری ، فرایند توسعه ، از جمله تشخیص Wake Word ، تشخیص گفتار و ادغام API را شرح می دهد ، در نهایت با هدف دستیابی به یک دستیار صوتی باهوش تر قادر به ارائه پاسخ مستقیم به جای پیوندهای جستجوی ساده است.

وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/l/crafting-a-custom-voice-assistant-with-perplexity-2