7 پروژه LLM برای تقویت پورتفولیوی یادگیری ماشین شما


7 پروژه LLM برای تقویت پورتفولیوی یادگیری ماشین شما

7 پروژه LLM برای تقویت پورتفولیوی یادگیری ماشین شما
تصویر نویسنده | ایجاد شده در Canva

مدل های زبان بزرگ (LLM) در کارهای مختلف بسیار مفید هستند. ساخت برنامه های کاربردی مبتنی بر LLM در ابتدا می تواند بسیار دلهره آور به نظر برسد. اما تنها چیزی که نیاز دارید این است:

  • توانایی کدنویسی، ترجیحاً در پایتون یا TypeScript و
  • چند کار یا مشکل نه چندان سرگرم کننده که دوست دارید ساده تر کنید (مطمئنم که تعداد زیادی دارید!).

برای ساخت برنامه های LLM، باید بتوانید LLM ها را اجرا کرده و با آنها تعامل داشته باشید، به منابع داده مختلف متصل شوید – فایل های موجود در ماشین محلی خود، API ها، پایگاه های داده و موارد دیگر. موارد زیر لیست کاملی نیست، اما در اینجا برخی از ابزارها و چارچوب هایی وجود دارد که می توانید برای ایجاد برنامه های کاربردی با LLM از آنها استفاده کنید:

  • زبان های برنامه نویسی: Python، TypeScript
  • چارچوب ها: LangChain، LlamaIndex
  • API ها: OpenAI API، Cohere API
  • اجرای LLM: اولاما، لامافیل
  • پایگاه های داده برداری: ChromaDB، Weaviate، Pinecone و موارد دیگر

این راهنما شامل هفت پروژه جالبی است که می توانید با LLM بسازید. در طول مسیر، کار با پایگاه های داده برداری، چارچوب ها و API های مفید را یاد خواهید گرفت. ما همچنین منابع یادگیری و پروژه‌های نمونه را به اشتراک می‌گذاریم تا به شما کمک کنیم تا به مرحله اجرا برسید. بیایید شروع کنیم.

1. برنامه پرسش و پاسخ مبتنی بر بازیابی برای اسناد فنی

یک سیستم پرسش و پاسخ برای توسعه دهندگان بسازید که از RAG برای استخراج اسناد فنی مختلف، پاسخ های Stack Overflow یا اسناد داخلی و پایگاه های دانش در صورت نیاز استفاده می کند. چنین اپلیکیشنی می تواند مفاهیم پیچیده را خلاصه و شفاف کند یا به سوالات فنی خاص پاسخ دهد.

اجزای کلیدی در پروژه عبارتند از:

  • چارچوب RAG که اسناد و اسنیپت های مربوطه را بازیابی می کند
  • LLM های منبع باز برای تفسیر سوالات و ایجاد پاسخ
  • ادغام با API برای منابع خارجی مانند Stack Overflow، Confluence

کمک به توسعه دهندگان با پاسخ های فوری و قابل اعتماد به سوالات فنی بدون جستجوی دستی در اسناد بزرگ. این می تواند به ویژه برای چارچوب هایی مانند جنگو که اسناد گسترده هستند مفید باشد.

برای یادگیری همه چیز در مورد RAG، بررسی کنید LangChain: با داده های خود از DeepLearning.AI چت کنید و RAG را از ابتدا یاد بگیرید.

2. LLM-Powered Workflow Automation Agent

عاملی ایجاد کنید که بتواند گردش های کاری تکراری و کارهای خسته کننده را بر اساس دستورالعمل های زبان طبیعی ساده کند. عامل باید بتواند از طریق دنباله ای از مراحل یا از قبل تعریف شده یا به طور مستقل با توجه به هدف نهایی کار کند.

چنین عاملی باید بتواند کارهایی مانند ایجاد پوشه های پروژه جدید، راه اندازی مخازن Git، ایجاد فایل های وابستگی پروژه و موارد دیگر را انجام دهد.

اجزای کلیدی، علاوه بر LLM، عبارتند از:

  • ادغام API برای ابزارهای مختلف مانند Docker، Git و AWS
  • موتوری برای اجرای اسکریپت های تولید شده توسط LLM

می‌توانید اولین نسخه‌ای را که می‌سازید بهبود بخشید تا برنامه مفیدتری دریافت کنید که راه‌اندازی دستی و وظایف سرپرست را برای توسعه‌دهندگان یا تیم‌ها کاهش می‌دهد و به آن‌ها اجازه می‌دهد روی کارهای با ارزش‌تر تمرکز کنند.

3. Text-to-SQL Query Generator

فکر کردن به سوالات تجاری به زبان انگلیسی ساده همیشه بصری و ساده تر است. با این حال، یک سوال ساده مانند “فروش فصلی یک محصول خاص در بخش های مختلف مشتریان چقدر است؟” ممکن است به یک پرس و جوی SQL نسبتاً پیچیده با اتصالات و چندین سؤال فرعی ترجمه شود. به همین دلیل است که ساخت یک مولد متن به SQL می تواند کمک کند.

می توانید برنامه ای بسازید که پرس و جوهای زبان طبیعی را با استفاده از LLM به SQL ترجمه کند. برنامه باید:

  • ورودی کاربر را بر اساس یک طرح پایگاه داده از پیش تعریف شده به پرس و جوهای SQL تبدیل کنید
  • آنها را در برابر یک پایگاه داده متصل اجرا می کند تا داده های مربوطه را برگرداند

در اینجا نمونه ای از مراحل اجرایی پروژه آمده است: برنامه متنی پایان به انتها به SQL LLM توسط کریش نایک

4. مولد اسناد مبتنی بر هوش مصنوعی برای پایگاه های کد

ابزاری بسازید که از یک LLM برای اسکن مخازن کد و تولید خودکار اسناد جامع استفاده کند. از جمله خلاصه توابع، توضیحات ماژول، و نمای کلی معماری. می توانید آن را به عنوان یک ابزار CLI یا یک GitHub Action بسازید.

شما نیاز خواهید داشت:

  • ادغام با سرویس های مخزن برای اسکن فایل های کد پایه
  • گزینه‌هایی برای بازبینی و افزودن بازخورد برای اصلاح یا ویرایش اسناد تولید شده

یک نسخه پیشرفته تر از چنین ژنراتوری در واقع می تواند برای تولید خودکار اسناد فنی برای تیم های توسعه استفاده شود. اگرچه دریافت اسناد بی نقص می تواند یک چالش باشد، چنین ابزاری قطعا باعث صرفه جویی در ساعات کار می شود!

5. دستیار کدنویسی هوش مصنوعی

یک دستیار کدنویسی مجهز به LLM بسازید که می تواند به عنوان یک برنامه نویس جفت در زمان واقعی عمل کند. این ابزار باید پیشنهاداتی را ارائه دهد، قطعات کد بنویسد، کدهای موجود را اشکال زدایی کند، و حتی توضیحاتی را در زمان واقعی در مورد منطق پیچیده در طول یک جلسه برنامه نویسی زنده ارائه دهد.

هنگام ساخت چنین برنامه ای، اطمینان حاصل کنید:

  • انتخاب خوبی از LLM هایی که در تولید کد خوب هستند
  • ادغام IDE، مانند پسوند VS Code، برای عملکرد درون ویرایشگر.
  • آگاهی متنی از محیط کدگذاری فعلی – کتابخانه های مورد استفاده، باز شدن فایل ها و موارد مشابه

بررسی کنید آموزش ADVANCED Python AI Agent – ​​با استفاده از RAG برای بررسی کامل ساخت دستیار کدنویسی.

6. سازنده خط لوله داده مبتنی بر متن

یک برنامه LLM توسعه دهید که به کاربران امکان می دهد خطوط لوله داده را به زبان طبیعی توصیف کنند. بگویید: “یک اسکریپت ETL بنویسید تا فایل CSV را از S3 وارد کنید، داده ها را پاک کنید و در پایگاه داده PostgreSQL بارگذاری کنید”. سپس برنامه باید کد یک خط لوله کامل ETL را با استفاده از ابزارهایی مانند Apache Airflow یا Prefect تولید کند.

بنابراین باید روی موارد زیر تمرکز کنید:

  • پشتیبانی از منابع داده های مختلف (S3، پایگاه های داده) و مقصد.
  • اتوماسیون ایجاد خط لوله و برنامه ریزی با ابزارهایی مانند جریان هوا.

این باید به شما کمک کند تا خطوط لوله داده پیچیده را با حداقل کدگذاری بسازید و برنامه ریزی کنید. حتی اگر کد کاملاً دقیق نباشد، در مقایسه با نوشتن خط لوله از ابتدا، باید به شما کمک کند مراحل زیادی را جلوتر شروع کنید.

7. LLM-Powered Code Migration Tool

راه‌حل‌هایی وجود دارد، اما می‌توانید ابزارهای انتقال کد ساخت را از ابتدا امتحان کنید. ابزاری بسازید که می تواند کدهای نوشته شده در یک زبان برنامه نویسی را تجزیه و تحلیل کند و آن را به زبان دیگری تبدیل کند و با استفاده از LLM ها منطق اصلی را درک کرده و آن را در زبان مقصد دوباره پیاده سازی کند. برای مثال، ممکن است بخواهید کد پایتون را به Go یا Rust منتقل کنید.

شما باید موارد زیر را آزمایش کنید:

  • انتخاب رشته های LLM برای ترجمه کد بین زبان ها
  • ابزارهای تحلیل استاتیک برای اطمینان از صحت منطقی پس از ترجمه
  • پشتیبانی از پارادایم های مختلف و ساختارهای خاص زبان

چنین برنامه‌ای می‌تواند به انتقال پایگاه‌های کد قدیمی به زبان‌های جدیدتر و کارآمدتر با حداقل بازنویسی دستی کمک کند.

بسته بندی

این یک بسته بندی است! امیدوارم این ایده های پروژه برای شما جالب بوده باشد.

اینها باید نقطه شروع خوبی برای ایده های جالب و مفیدتری باشد که ممکن است داشته باشید. هنگامی که یک برنامه کاربردی ساختید، می توانید مسیرهای دیگر را کاوش کنید. برای مثال، ممکن است بخواهید با استفاده از RAG یک تحلیلگر صورت های مالی یا دستیار تحقیق شخصی خود بسازید.

همانطور که گفته شد، شما فقط به یک مشکل برای حل، علاقه به ساختن چیزها و قهوه نیاز دارید؟

کد نویسی مبارک!

بالا پریا سیبالا پریا سی

درباره بالا پریا سی

Bala Priya C یک توسعه دهنده و نویسنده فنی از هند است. او دوست دارد در تقاطع ریاضی، برنامه نویسی، علم داده و تولید محتوا کار کند. زمینه های مورد علاقه و تخصص او شامل DevOps، علم داده و پردازش زبان طبیعی است. او از خواندن، نوشتن، کدنویسی و قهوه لذت می برد! در حال حاضر، او در حال کار بر روی یادگیری و به اشتراک گذاری دانش خود با جامعه توسعه دهندگان با نوشتن آموزش ها، راهنماهای نحوه انجام، نظرات و موارد دیگر است. Bala همچنین مروری بر منابع جذاب و آموزش های کدنویسی ایجاد می کند.



منبع: machinelearningmastery.com

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *