باز کردن پتانسیل واقعی هوش مصنوعی موبایل

شرکت ها هنوز در حال بررسی پتانسیل هوش مصنوعی مولد و مدل های زبان بزرگ (LLM) هستند. اما این بدان معنا نیست که آنها در حال حاضر به دنبال مرز بعدی نیستند. برای بسیاری، هوش مصنوعی تلفن همراه واقعی جام مقدس است: گشودن دستگاه‌ها به سمت فرصت‌هایی که به‌طور سنتی توسط برنامه‌های کاربردی انرژی‌زا و تشنه منابع ارائه می‌شوند.

این تنها یک تثبیت بر روی گوشی‌های هوشمند یا دستگاه‌های دیگر نیست – اگرچه برنامه‌های کاربردی متمرکز بر مصرف‌کننده و کسب‌وکار قطعاً این موارد را هدف خواهند دید. همچنین به معنای گسترش حضور هوش مصنوعی مولد در سراسر اینترنت اشیا (IoT) است که به طور بالقوه سیستم های عملیاتی واقعاً هوشمند را ایجاد می کند.

سوال این است که چگونه می توان به این امر دست یافت. یک دستگاه تلفن همراه مدرن با نوکیا 3210 فاصله زیادی دارد، اما حتی این جهش نمایی برای استفاده از LLM کافی نیست. بنابراین اگر اسب بخار محاسباتی راه حل نیست، چیست؟

ساختن معماری مناسب

ممکن است فرض بر این باشد که هوش مصنوعی تلفن همراه تنها می تواند در فضای ابری وجود داشته باشد که سرورهای مرکزی پردازش های سنگین را انجام می دهند و دستگاه فقط نتایج را نشان می دهد. با این حال، برای موفقیت، هوش مصنوعی موبایل واقعی باید پیوندهایی را که ابر را ضروری می کند، قطع کند. اتصال مطمئناً یک مشکل است – برنامه‌ای که اگر نتواند به ابر متصل شود، غیر کاربردی است، بلافاصله ارزش کمتری دارد. اما سوالات مربوط به کارایی، سرعت و حفظ حریم خصوصی داده ها نیز وجود دارد.

مرتبط:چگونه هوش مصنوعی زنجیره تامین صنعت نساجی را تغییر می دهد

بهترین برنامه های مولد هوش مصنوعی تا حد امکان نزدیک به زمان واقعی عمل می کنند. هر ثانیه تاخیر به این معنی است که داده ها کمتر به روز هستند، پاسخ ها کندتر هستند و هر نتیجه ای که هوش مصنوعی به آن می رسد کمتر قابل اعتماد است. تأخیر ذاتی در انتقال داده به و از یک سرور مرکزی به این معنی است که رویکرد مبتنی بر ابر همیشه کوتاه خواهد بود. در عین حال، سازمان‌ها باید با هزینه‌های پهنای باند انتقال ثابت داده‌ها و خطر به خطر افتادن داده‌های در حال انتقال مقابله کنند. بدیهی است که هر چه اتفاقات بیشتری روی خود دستگاه بیفتد، بهتر است.

این بدان معنا نیست که سرورهای ابری نامربوط هستند. کارهایی با نیازهای محاسباتی بالا که یک دستگاه تلفن همراه هرگز نمی تواند مطابقت داشته باشد – مانند آموزش LLM ها و مدل های یادگیری عمیق آنها – هنوز برای سرورهای ابری مناسب هستند. با این حال، فرآیندهای یادگیری ماشین و هر کاری که نیاز به تعامل فوری بین کاربران و خود هوش مصنوعی دارد، باید روی دستگاه در لبه شبکه اتفاق بیفتد. این به معنای کاهش بار محاسباتی بر روی دستگاه و اطمینان از اینکه یک معماری بر اساس نیازهای خاص محاسبات لبه ساخته شده است.

برداشتن بار از دستگاه ها

قرار دادن سنگین ترین بار محاسباتی بر روی ابر کمک می کند تا هوش مصنوعی موبایل واقعی را در دسترس قرار دهید. اما قبل از اینکه یک دستگاه تلفن همراه بتواند برنامه‌های هوش مصنوعی تولیدی را در سطح عملکرد لازم اجرا کند، این بار باید حتی بیشتر کاهش یابد.

مرتبط:استقبال از هوش مصنوعی در کمک های بین المللی

در نهایت، بیشترین بار از خود مدل هوش مصنوعی ناشی می شود. هرچه بتوان این موارد را ساده‌تر کرد – به عنوان مثال، دقت محاسبات را در پارامترهای قابل قبول کاهش داد – بار دستگاه کمتر می‌شود. به طور مشابه، بهینه سازی عملیات در جاهای دیگر برای بهره وری بیشتر، تضمین می کند که دستگاه می تواند بیشترین منابع ممکن را به برنامه های کاربردی هوش مصنوعی مولد خود اختصاص دهد.

رویکرد دقیق به نیازهای خاص هر برنامه بستگی دارد. اما کوانتیزاسیون مدل به طور کلی یک گام اساسی در جهت ساده سازی مدل هوش مصنوعی به اندازه کافی برای اجرای موثر است. فراتر از این، رویکردهایی مانند GPTQ که مدل‌ها را پس از آموزش فشرده می‌کند. LoRA، که ماتریس های کوچکتر را در یک مدل از پیش آموزش دیده تنظیم می کند. و QLoRA که استفاده از حافظه GPU را برای کارایی بیشتر بهینه می کند، می تواند بار را بیشتر کاهش دهد و هوش مصنوعی واقعی موبایل را در دسترس قرار دهد.

مدیریت داده ها

در نهایت، مانند هر برنامه دیگری، هوش مصنوعی نیازمند مدیریت دقیق داده است. اول، داده ها باید خصوصی و ایمن باشند. پیاده‌سازی تکنیک‌هایی که حریم خصوصی را حفظ می‌کنند، مانند جلوگیری از انتقال داده‌ها از دستگاه به مدل یادگیری LLM، و تکمیل آنها با رمزگذاری داده‌ها به‌گونه‌ای که داده‌ها حتی در صورت وقوع بدترین اتفاق محافظت شوند، باید در اولویت باشند.

دوم، داده ها باید در کل شبکه یکسان باشند. برای اطمینان از یکپارچگی، همگام سازی داده ها بین دستگاه های لبه و سایر سرورهای ابری یا مرکزی بسیار مهم خواهد بود. با وجود این موارد، سازمان می‌داند که هوش مصنوعی آن داده‌های یکسانی را روی همه دستگاه‌ها کار می‌کند و بنابراین به نتایج غیرمنتظره یا حتی خطرناک نمی‌رسد.

در این شرایط، یک پلت فرم داده تلفیقی که می تواند انواع داده های مختلف را مدیریت کند و مدل های هوش مصنوعی را قادر می سازد به فروشگاه های داده محلی دسترسی داشته باشند، یک مزیت قابل توجه خواهد بود. پلت‌فرم داده‌ای که دسترسی آفلاین یا آنلاین، افزایش عملکرد و تجربه کاربری بهبودیافته را امکان‌پذیر می‌سازد نیز همینطور خواهد بود. با وجود پلتفرم مناسب، برنامه‌های هوش مصنوعی می‌توانند در محیط‌های مختلف کار کنند و پاسخگویی و قابلیت اطمینان را تضمین کنند و در نتیجه ابزاری بسیار با ارزش‌تر ایجاد کنند.

قانون طلایی

در نهایت، مدیریت داده و معماری به قانون طلایی در قلب بسیاری از استراتژی‌های فناوری اطلاعات بازمی‌گردند: آن را ساده نگه دارید. هرچه سازمان‌ها بتوانند پیچیدگی را به حداقل برسانند، قدرت و تمرکز بیشتری را می‌توانند به خود هوش مصنوعی اختصاص دهند. در یک محیط موبایل، که در آن هر بایت از اسب بخار محاسبه می شود، این برای موفقیت بسیار مهم است.

منبع: https://aibusiness.com/generative-ai/unlocking-the-true-potential-of-mobile-ai