شرکت ها هنوز در حال بررسی پتانسیل هوش مصنوعی مولد و مدل های زبان بزرگ (LLM) هستند. اما این بدان معنا نیست که آنها در حال حاضر به دنبال مرز بعدی نیستند. برای بسیاری، هوش مصنوعی تلفن همراه واقعی جام مقدس است: گشودن دستگاهها به سمت فرصتهایی که بهطور سنتی توسط برنامههای کاربردی انرژیزا و تشنه منابع ارائه میشوند.
این تنها یک تثبیت بر روی گوشیهای هوشمند یا دستگاههای دیگر نیست – اگرچه برنامههای کاربردی متمرکز بر مصرفکننده و کسبوکار قطعاً این موارد را هدف خواهند دید. همچنین به معنای گسترش حضور هوش مصنوعی مولد در سراسر اینترنت اشیا (IoT) است که به طور بالقوه سیستم های عملیاتی واقعاً هوشمند را ایجاد می کند.
سوال این است که چگونه می توان به این امر دست یافت. یک دستگاه تلفن همراه مدرن با نوکیا 3210 فاصله زیادی دارد، اما حتی این جهش نمایی برای استفاده از LLM کافی نیست. بنابراین اگر اسب بخار محاسباتی راه حل نیست، چیست؟
ساختن معماری مناسب
ممکن است فرض بر این باشد که هوش مصنوعی تلفن همراه تنها می تواند در فضای ابری وجود داشته باشد که سرورهای مرکزی پردازش های سنگین را انجام می دهند و دستگاه فقط نتایج را نشان می دهد. با این حال، برای موفقیت، هوش مصنوعی موبایل واقعی باید پیوندهایی را که ابر را ضروری می کند، قطع کند. اتصال مطمئناً یک مشکل است – برنامهای که اگر نتواند به ابر متصل شود، غیر کاربردی است، بلافاصله ارزش کمتری دارد. اما سوالات مربوط به کارایی، سرعت و حفظ حریم خصوصی داده ها نیز وجود دارد.
بهترین برنامه های مولد هوش مصنوعی تا حد امکان نزدیک به زمان واقعی عمل می کنند. هر ثانیه تاخیر به این معنی است که داده ها کمتر به روز هستند، پاسخ ها کندتر هستند و هر نتیجه ای که هوش مصنوعی به آن می رسد کمتر قابل اعتماد است. تأخیر ذاتی در انتقال داده به و از یک سرور مرکزی به این معنی است که رویکرد مبتنی بر ابر همیشه کوتاه خواهد بود. در عین حال، سازمانها باید با هزینههای پهنای باند انتقال ثابت دادهها و خطر به خطر افتادن دادههای در حال انتقال مقابله کنند. بدیهی است که هر چه اتفاقات بیشتری روی خود دستگاه بیفتد، بهتر است.
این بدان معنا نیست که سرورهای ابری نامربوط هستند. کارهایی با نیازهای محاسباتی بالا که یک دستگاه تلفن همراه هرگز نمی تواند مطابقت داشته باشد – مانند آموزش LLM ها و مدل های یادگیری عمیق آنها – هنوز برای سرورهای ابری مناسب هستند. با این حال، فرآیندهای یادگیری ماشین و هر کاری که نیاز به تعامل فوری بین کاربران و خود هوش مصنوعی دارد، باید روی دستگاه در لبه شبکه اتفاق بیفتد. این به معنای کاهش بار محاسباتی بر روی دستگاه و اطمینان از اینکه یک معماری بر اساس نیازهای خاص محاسبات لبه ساخته شده است.
برداشتن بار از دستگاه ها
قرار دادن سنگین ترین بار محاسباتی بر روی ابر کمک می کند تا هوش مصنوعی موبایل واقعی را در دسترس قرار دهید. اما قبل از اینکه یک دستگاه تلفن همراه بتواند برنامههای هوش مصنوعی تولیدی را در سطح عملکرد لازم اجرا کند، این بار باید حتی بیشتر کاهش یابد.
در نهایت، بیشترین بار از خود مدل هوش مصنوعی ناشی می شود. هرچه بتوان این موارد را سادهتر کرد – به عنوان مثال، دقت محاسبات را در پارامترهای قابل قبول کاهش داد – بار دستگاه کمتر میشود. به طور مشابه، بهینه سازی عملیات در جاهای دیگر برای بهره وری بیشتر، تضمین می کند که دستگاه می تواند بیشترین منابع ممکن را به برنامه های کاربردی هوش مصنوعی مولد خود اختصاص دهد.
رویکرد دقیق به نیازهای خاص هر برنامه بستگی دارد. اما کوانتیزاسیون مدل به طور کلی یک گام اساسی در جهت ساده سازی مدل هوش مصنوعی به اندازه کافی برای اجرای موثر است. فراتر از این، رویکردهایی مانند GPTQ که مدلها را پس از آموزش فشرده میکند. LoRA، که ماتریس های کوچکتر را در یک مدل از پیش آموزش دیده تنظیم می کند. و QLoRA که استفاده از حافظه GPU را برای کارایی بیشتر بهینه می کند، می تواند بار را بیشتر کاهش دهد و هوش مصنوعی واقعی موبایل را در دسترس قرار دهد.
مدیریت داده ها
در نهایت، مانند هر برنامه دیگری، هوش مصنوعی نیازمند مدیریت دقیق داده است. اول، داده ها باید خصوصی و ایمن باشند. پیادهسازی تکنیکهایی که حریم خصوصی را حفظ میکنند، مانند جلوگیری از انتقال دادهها از دستگاه به مدل یادگیری LLM، و تکمیل آنها با رمزگذاری دادهها بهگونهای که دادهها حتی در صورت وقوع بدترین اتفاق محافظت شوند، باید در اولویت باشند.
دوم، داده ها باید در کل شبکه یکسان باشند. برای اطمینان از یکپارچگی، همگام سازی داده ها بین دستگاه های لبه و سایر سرورهای ابری یا مرکزی بسیار مهم خواهد بود. با وجود این موارد، سازمان میداند که هوش مصنوعی آن دادههای یکسانی را روی همه دستگاهها کار میکند و بنابراین به نتایج غیرمنتظره یا حتی خطرناک نمیرسد.
در این شرایط، یک پلت فرم داده تلفیقی که می تواند انواع داده های مختلف را مدیریت کند و مدل های هوش مصنوعی را قادر می سازد به فروشگاه های داده محلی دسترسی داشته باشند، یک مزیت قابل توجه خواهد بود. پلتفرم دادهای که دسترسی آفلاین یا آنلاین، افزایش عملکرد و تجربه کاربری بهبودیافته را امکانپذیر میسازد نیز همینطور خواهد بود. با وجود پلتفرم مناسب، برنامههای هوش مصنوعی میتوانند در محیطهای مختلف کار کنند و پاسخگویی و قابلیت اطمینان را تضمین کنند و در نتیجه ابزاری بسیار با ارزشتر ایجاد کنند.
قانون طلایی
در نهایت، مدیریت داده و معماری به قانون طلایی در قلب بسیاری از استراتژیهای فناوری اطلاعات بازمیگردند: آن را ساده نگه دارید. هرچه سازمانها بتوانند پیچیدگی را به حداقل برسانند، قدرت و تمرکز بیشتری را میتوانند به خود هوش مصنوعی اختصاص دهند. در یک محیط موبایل، که در آن هر بایت از اسب بخار محاسبه می شود، این برای موفقیت بسیار مهم است.
منبع: https://aibusiness.com/generative-ai/unlocking-the-true-potential-of-mobile-ai