شماره 53 چگونه شبکه های عصبی ویژگی ها را بیشتر از ابعاد یاد می گیرند


نویسنده(های): به سمت تیم تحریریه هوش مصنوعی

در ابتدا منتشر شد به سمت هوش مصنوعی.

صبح بخیر، علاقه مندان به هوش مصنوعی! این موضوع دارای منابع سنگین اما بسیار سرگرم کننده است، با مفاهیم هوش مصنوعی در دنیای واقعی، آموزش ها و برخی موارد LLM ملزومات ما در حال غواصی در تفسیرپذیری مکانیکی هستیم، یک حوزه تحقیقاتی نوظهور در هوش مصنوعی که بر درک عملکرد درونی شبکه‌های عصبی متمرکز است. ما همچنین بخش مهمی از خط لوله RAG را پوشش می‌دهیم: مدل تعبیه و موضوعات دیگر مانند رگرسیون لجستیک وزن پویا (DWLR)، شبکه عصبی تعامل پویا (DINN)، و بسیاری موارد دیگر!

هفتگی هوش مصنوعی چیست

این هفته در هوش مصنوعی چیست؟، من به بخش مهمی از خط لوله بازیابی-نسل تقویت شده (RAG) می پردازم: مدل تعبیه. تمام داده‌های شما به جاسازی‌هایی تبدیل می‌شوند که سپس از آنها برای بازیابی اطلاعات استفاده می‌کنیم. بنابراین، درک مدل‌های جاسازی بسیار مهم است. بیایید به این بخش مهم خط لوله، نحوه تنظیم دقیق آنها و چرایی اهمیت آن بپردازیم. مقاله کامل را اینجا بخوانیدیا اگر ترجیح می دهید تماشا کنید، ویدیوی کامل را در یوتیوب ببینید.

– لویی فرانسوا بوچارد، بنیانگذار و رئیس انجمن به سوی هوش مصنوعی

بخش جامعه هوش مصنوعی را یاد بگیرید!

پست انجمن ویژه از Discord

اشنو با استفاده از OpenGPA و R2R، با استفاده از پرس و جوهای پیچیده روی اسکریپت های فیلم، آزمایش هایی را با RAG منبع باز انجام داده است. آنها یک پست وبلاگی نوشته اند که در مورد نتایج و محدودیت های رویکردهای فعلی RAG بحث می کند. این وبلاگ همچنین ایده یک معیار RAG را بر اساس فیلمنامه‌های فیلم معرفی می‌کند و ایده‌هایی را برای حل این مشکل زمینه در RAG بررسی می‌کند. وبلاگ را در اینجا بررسی کنید و از یکی از اعضای جامعه حمایت کنید. نظرات و سوالات خود را در تاپیک دیسکورد به اشتراک بگذارید!

فرصت های همکاری

انجمن Learn AI Together Discord مملو از فرصت های همکاری است. اگر مشتاق هستید که در هوش مصنوعی کاربردی شیرجه بزنید، یک شریک تحصیلی می خواهید، یا حتی می خواهید شریکی برای پروژه اشتیاق خود پیدا کنید، به کانال همکاری بپیوندید! مراقب این بخش نیز باشید – ما هر هفته فرصت های جالبی را به اشتراک می گذاریم!

1. کیوبیت 81 در حال ایجاد یک گروه همسالان کوچک است که می توانیم در مسابقات Kaggle شرکت کنیم، روی پروژه ها کار کنیم و با هم رشد کنیم. اگر به نظر سرگرم کننده است، در تاپیک به سمت او دراز کنید!

2. Jjj8405 به دنبال یک NLP/LLM متخصص برای پیوستن به تیم برای یک پروژه اگر این برای شما مرتبط است، در نخ وصل کنید!

میم هفته!

میم به اشتراک گذاشته شد ghost_in_the_machine

بخش سرپرستی TAI

مقاله هفته

مدل‌های وزن پویا: پل زدن GLM و شبکه‌های عصبی توسط شنگانگ لی

این مقاله توسعه دو مدل پیش‌بینی جدید را بررسی می‌کند: رگرسیون لجستیک وزن پویا (DWLR) و شبکه عصبی تعامل پویا (DINN). DWLR محدودیت های رگرسیون لجستیک سنتی را با ترکیب وزن های تنظیم شده به صورت پویا بر اساس ویژگی های ورودی و توابع فعال سازی برطرف می کند. معیار در برابر رگرسیون لجستیک، XGBoost، LightGBM، جنگل تصادفیو GAM، DWLR عملکرد برتر را در چندین معیار، به ویژه دقت و AUC نشان دادند. DINN DWLR را با افزودن اصطلاحات تعامل ویژگی، ایجاد یک عصبی گسترش می دهد معماری شبکه. در حالی که عملکرد DINN رقابتی بود، پتانسیل بهبود بیشتر را از طریق تکنیک‌های منظم‌سازی و بهینه‌سازی نشان داد. نویسنده کد و داده را برای تکرارپذیری ارائه می دهد.

مقالاتی که باید حتما بخوانید

1. چگونه یک دستیار هوش مصنوعی با استفاده از GraphRAG برای بخش BFSI بسازیم توسط آشیش آبراهام

این مقاله به بررسی ساخت دستیار هوش مصنوعی مبتنی بر GraphRAG برای بخش BFSI با استفاده از FalkorDB می‌پردازد. این محدودیت‌های سیستم‌های RAG سنتی را در رسیدگی به پرس‌و‌جوهای پیچیده و چند هاپ با یکپارچه‌سازی نمودارهای دانش برطرف می‌کند. مزایای پایگاه داده های گراف را نسبت به پایگاه های داده برداری برای این برنامه توضیح می دهد و سرعت و کارایی FalkorDB را برجسته می کند. این فرآیند شامل ایجاد یک نمودار دانش از یک PDF با استفاده از LangChain و یک LLM، ایجاد پرس‌وجوهای Cypher برای بازیابی داده‌ها، و استفاده از یک رویکرد دوگانه LLM برای تجزیه و تحلیل و تولید پاسخ است. رابط Gradio این مؤلفه‌ها را در یک ربات چت کاربردی ادغام می‌کند و نشان می‌دهد که چگونه این معماری می‌تواند پشتیبانی مشتری را با مدیریت کارآمد داده‌های مالی پیچیده و پاسخ دادن به سؤالات پیچیده مشتری بهبود بخشد.

2. تفسیرپذیری مکانیکی: برهم نهی چیست؟ توسط بلوک های ساختمانی

این مقاله قابلیت تفسیر مکانیکی را با تمرکز بر برهم نهی در شبکه های عصبی بررسی می کند. این توضیح می‌دهد که چگونه شبکه‌ها می‌توانند ویژگی‌های بیشتری نسبت به ابعاد پنهان‌شان بیاموزند، پدیده‌ای که مخصوصاً برای LLM و مدل‌های انتشار مرتبط است. یک مدل رمزگذار خودکار ساده شده برای نشان دادن این مورد استفاده می‌شود و مدل‌های خطی و غیرخطی را با پراکندگی ویژگی‌های متفاوت مقایسه می‌کند. نتایج نشان می‌دهد که مدل‌های غیرخطی با ویژگی‌های پراکنده، برهم‌نهی، استفاده از شرایط تعصب و فعال‌سازی ReLU را برای کاهش تداخل ویژگی و بهبود نمایش نشان می‌دهند.

3. تسلط بر ردیابی و نظارت بر عوامل AutoGen با Microsoft PromptFlow توسط چین می باالرائو

این مقاله توضیح می دهد که چگونه Microsoft PromptFlow ردیابی و نظارت بر عوامل AutoGen را بهبود می بخشد و به اشکال زدایی و بهینه سازی برنامه های کاربردی مبتنی بر LLM کمک می کند. PromptFlow، یک ابزار جامع توسعه برنامه LLM، کل چرخه عمر برنامه را از توسعه تا نظارت ساده می کند. این یک گردش کار با چندین عامل AutoGen را نشان می دهد و از قابلیت های ردیابی PromptFlow برای ردیابی تعاملات عامل استفاده می کند. در حالی که مزایا را برجسته می‌کند، محدودیت‌هایی مانند ردیابی به‌عنوان پخش زنده کار نمی‌کند و برخی از چالش‌های راه‌اندازی اولیه که نیاز به اصلاح کد در کتابخانه PromptFlow دارند را نیز یادداشت می‌کند.

اگر علاقه مند به انتشار با Towards AI هستید، دستورالعمل های ما را بررسی کنید و ثبت نام کنید. اگر کار شما با خط مشی ها و استانداردهای ویرایشی ما مطابقت داشته باشد، ما آن را در شبکه خود منتشر خواهیم کرد.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/53-how-neural-networks-learn-more-features-than-dimensions-2

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *