#47 ساختن یک NotebookLM Clone، خوشه بندی سری های زمانی، تنظیم دستورالعمل، و موارد دیگر!


نویسنده(های): به سمت تیم تحریریه هوش مصنوعی

در ابتدا منتشر شد به سمت هوش مصنوعی.

صبح بخیر، علاقه مندان به هوش مصنوعی! همانطور که ما اکتبر را به پایان می رسانیم، مجموعه ای از منابع متنوع را برای شما گردآوری کرده ایم – از آخرین پیشرفت ها در هوش مصنوعی مولد به نکاتی برای تنظیم دقیق جریان های کاری LLM، از ساختن شبیه سازی NotebookLM خود تا تنظیم دستورالعمل. ما همچنین برای به اشتراک گذاشتن به‌روزرسانی‌های Building LLMs for Production که اکنون در پلتفرم خودمان در دسترس است، هیجان‌زده هستیم: Towards AI Academy.

همچنین هالووین را به همه کسانی که جشن می گیرند تبریک می گویم. از خواندن لذت ببرید!

– لویی فرانسوا بوچارد، بنیانگذار و رئیس انجمن به سوی هوش مصنوعی

🎉 خبر عالی! ساخت LLM برای تولید اکنون به عنوان یک کتاب الکترونیکی با قیمت انحصاری در Towards AI Academy در دسترس است!

با در دسترس قرار دادن آن بر روی پلتفرم خود، ما نه تنها هزینه را کاهش می دهیم – بلکه دسترسی، یادگیری و رشد مهارت های خود را با این راهنمای ضروری برای شما آسان تر از همیشه می کنیم.

برای اولین بار، می‌توانید مستقیماً از طریق پلتفرم ما به این راهنمای جامع برای طراحی، استقرار و مقیاس‌بندی مدل‌های زبان دسترسی داشته باشید – و با قیمتی کمتر از آمازون!

این کتاب الکترونیکی همه چیز را از مفاهیم اساسی گرفته تا تکنیک‌های پیشرفته و برنامه‌های کاربردی در دنیای واقعی پوشش می‌دهد و یک تجربه یادگیری ساختاریافته و عملی را ارائه می‌دهد. اگر قبلاً نسخه اول را دارید، واجد شرایط تخفیف اضافی هستید – فقط کافی است با آن تماس بگیرید [email protected] برای ارتقا مقرون به صرفه!

دریافت کنید ساخت LLM برای تولید به سمت آکادمی هوش مصنوعی و سایر ابزارهای موجود برای پشتیبانی از سفر هوش مصنوعی خود را کشف کنید!

ما به زودی پلتفرم دوره آموزشی جدید خود به سمت آکادمی هوش مصنوعی را با مجموعه ای از دوره های عملی بسیار عمیق LLM راه اندازی خواهیم کرد، پس با ما همراه باشید!

بخش جامعه هوش مصنوعی را یاد بگیرید!

نظرسنجی هفته هوش مصنوعی!

ما مدت‌هاست که از RAG به‌عنوان یکی از کاربردی‌ترین راه‌ها برای قابل اعتمادتر کردن و سفارشی‌سازی LLM‌ها پشتیبانی می‌کنیم. ما دوست داریم نظرات شما را در مورد اینکه آیا RAG اینجا می‌ماند و چرا، بشنویم. آنها را در تاپیک در Discord به اشتراک بگذارید!

فرصت های همکاری

انجمن Learn AI Together Discord مملو از فرصت های همکاری است. اگر مشتاق هستید که در هوش مصنوعی کاربردی شیرجه بزنید، یک شریک تحصیلی می خواهید، یا حتی می خواهید شریکی برای پروژه اشتیاق خود پیدا کنید، به کانال همکاری بپیوندید! مراقب این بخش نیز باشید – ما هر هفته فرصت های جالبی را به اشتراک می گذاریم!

1. برگهای_طلایی68731 یک توسعه دهنده ارشد هوش مصنوعی است که به دنبال یک بنیانگذار غیر فنی است تا به سرمایه گذاری آنها بپیوندد. اگر این به نظر شما می رسد، در تاپیک دراز کنید!

2. Wildgamingyt به دنبال شخصی برای یادگیری هوش مصنوعی و ساخت پروژه است. اگر از یادگیری با یک شریک لذت می برید، در نخ وصل کنید!

3. Lazybutlearning_44405 برای هوش مصنوعی جدید است و به دنبال راهنمایی از جامعه است. اگه میتونی راهنماییش کنی در تاپیک دراز کنید!

میم هفته!

میم به اشتراک گذاشته شده توسط ghost_in_the_machine

بخش سرپرستی TAI

مقاله هفته

چگونه کلون NotebookLM را توسعه دادم؟ توسط واتصال سگلانی

این مقاله به بررسی ایجاد PDF2Pod، یک شبیه‌سازی NotebookLM می‌پردازد که اسناد PDF را به پادکست‌های جذاب و چند بلندگو تبدیل می‌کند. هدف PDF2Pod با الهام از NotebookLM Google، ایجاد بحث‌های صوتی پویا و کوتاه‌تر با حداکثر پنج بلندگو است که با گفتگوهای همپوشانی برای جریان مکالمه طبیعی‌تر کامل می‌شود. این جزئیات فرآیندهای استخراج متن از PDF، ایجاد گفتگو با استفاده از GPT-4o OpenAI، تبدیل آن گفتگو به صدا با استفاده از مدل متن به گفتار ElevenLabs، و توسعه یک رابط کاربر پسند Gradio که به کاربران اجازه می‌دهد فایل‌های PDF را آپلود کنند و دریافت کنند. کلیپ های صوتی پادکست، فرآیند تبدیل را بصری و قابل دسترس می کند.

مقالاتی که باید حتما بخوانید

1. یک رویکرد مدل ترکیبی برای خوشه‌بندی داده‌های سری زمانی توسط شنگانگ لی

این مقاله یک رویکرد مدل مخلوط را برای خوشه‌بندی داده‌های سری زمانی، به ویژه با تمرکز بر برنامه‌های مالی و بیولوژیکی بررسی می‌کند. از مدل‌های مخلوط گاوسی (GMM) ترکیب شده با توابع خودرگرسیون (AR)، میانگین متحرک (MA) و توابع روند غیرخطی برای گروه‌بندی سری‌های زمانی با ویژگی‌های آماری مشابه استفاده می‌کند. این روش به طور موثر هم روندهای بلندمدت و هم وابستگی های کوتاه مدت را ثبت می کند و درک دقیق تری از داده های پویا در مقایسه با روش های خوشه بندی سنتی ارائه می دهد. همچنین، این مقاله روش را با استفاده از داده‌های مصنوعی و واقعی قیمت سهام نشان می‌دهد و پتانسیل آن را برای شناسایی الگوها و تفاوت‌های نوسان در بازارهای مالی نشان می‌دهد.

2. یک راهنمای کامل برای جاسازی برای NLP و AI/LLM مولد توسط مدبدالله الحسب

این مقاله یک راهنمای جامع برای درک و پیاده سازی وکتور embedding در ارائه می دهد NLP و هوش مصنوعی مولد. مفهوم تعبیه، اهمیت آن را پوشش می دهد یادگیری ماشینی الگوریتم ها و نحوه استفاده از آن در LangChain برای برنامه های مختلف. تکنیک‌های مختلف جاسازی، از جمله Word2Vec، GloVe، BERT، و موارد دیگر را توضیح می‌دهد و نحوه استفاده از مدل‌های جاسازی را از ارائه‌دهندگانی مانند OpenAI، HuggingFace و Gemini در LangChain توضیح می‌دهد. همچنین نحوه ذخیره و بازیابی اسناد جاسازی شده را با استفاده از فروشگاه های برداری و تجسم جاسازی ها برای درک بهتر نشان می دهد. همچنین جاسازی‌های کش را با استفاده از LangChain برای سرعت بخشیدن به فرآیند و کارآمدتر کردن آن بررسی می‌کند.

3. بازسازی تصاویر تمیز از داده های نویز: دیدگاه استنتاج بیزی توسط بهوش آگون

این مقاله نگاهی دقیق به استفاده از استنتاج بیزی برای بازسازی تصاویر تمیز از داده های نویزدار ارائه می دهد. این اصول استنتاج بیزی را تشریح می کند و بر مناسب بودن آن برای مدیریت عدم قطعیت در بازسازی تصویر در زمینه هایی مانند تصویربرداری پزشکی، تصاویر ماهواره ای و نجوم تأکید می کند. با ترکیب دانش قبلی با مشاهدات پر سر و صدا، روش های بیزی بازسازی دقیق تری را امکان پذیر می کند. این تکنیک‌های عملی، از جمله انتشار باور، پیشین‌های گاوسی و زنجیره مارکوف مونت کارلو (MCMC)، برای تخمین احتمالی تصاویر تمیز.

4. بینش های کلیدی و بهترین شیوه ها در مورد تنظیم دستورالعمل توسط فلوریان جون

این مقاله بینش ها و بهترین شیوه ها را برای تنظیم آموزش در مدل های زبان بزرگ (LLM) ارائه می دهد. ملاحظات کلیدی مانند متعادل کردن کیفیت داده ها در مقابل کمیت، اطمینان از تنوع داده ها، و انتخاب روش تنظیم مناسب را پوشش می دهد. همچنین به چالش‌هایی در تنظیم دقیق، مانند حفظ قابلیت‌های عمومی و در عین حال بهبود عملکرد خاص کار، می‌پردازد. تکنیک هایی مانند سازگاری با رتبه پایین (LoRA) و تقطیر خود به عنوان استراتژی های تنظیم کارآمد برجسته می شوند و توصیه های عملی را برای توسعه دهندگانی که روی برنامه های تخصصی LLM کار می کنند ارائه می دهند.

اگر علاقه مند به انتشار با Towards AI هستید، دستورالعمل های ما را بررسی کنید و ثبت نام کنید. اگر کار شما با خط مشی ها و استانداردهای ویرایشی ما مطابقت داشته باشد، ما آن را در شبکه خود منتشر خواهیم کرد.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/47-building-a-notebooklm-clone-time-series-clustering-instruction-tuning-and-more