درک استدلال زنجیره‌ای از فکر (CoT): هسته پشت مدل o1 OpenAI


نویسنده(های): شیوام موهان

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

استدلال زنجیره‌ای از فکر (CoT) رویکردی است که به طور قابل‌توجهی توانایی‌های استدلال مدل‌های زبان بزرگ (LLM) را با تجزیه مشکلات پیچیده به مراحل کوچک‌تر و قابل مدیریت افزایش می‌دهد. CoT با تشویق یک مدل برای توضیح فرآیند فکری میانی خود، به آن کمک می‌کند تا به راه‌حل‌های دقیق‌تری برسد، به‌ویژه در کارهایی که نیاز به استدلال حسابی، عقل سلیم یا نمادین دارند.

عکس از کاغذ

در هسته خود، استدلال زنجیره‌ای از فکر در مورد ساختن یک مدل است که نه تنها به سؤالات پاسخ دهد، بلکه توضیح دهد که چگونه به پاسخ خود رسیده است. این روش نحوه حل انسان‌ها مسائل پیچیده را تقلید می‌کند – با تقسیم کردن آنها به مراحل کوچک‌تر و استدلال در هر مرحله.

به عنوان مثال، وقتی از راجر پرسیده شد که پس از خرید 2 قوطی دیگر (که هر کدام شامل 3 توپ) علاوه بر 5 توپ تنیس خود، چند توپ تنیس دارد، مدلی که از استدلال CoT استفاده می کند، استدلال خود را اینگونه توضیح می دهد:

راجر با 5 توپ شروع کرد. 2 قوطی از 3 توپ تنیس هر کدام 6 توپ دیگر می دهد. 5 + 6 = 11. جواب 11 است.

این را با استدلال استاندارد مقایسه کنید، جایی که مدل به طور مستقیم به 11 بدون توضیح مراحل مربوطه پاسخ می دهد.

1. تجزیه بهتر مشکل: CoT به مدل ها اجازه می دهد تا مسائل چند مرحله ای را به مراحل میانی ساده تر تقسیم کنند. این… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/understanding-chain-of-thought-cot-reasoning-the-core-behind-openais-o1-model