چگونه می توان تخصص انسانی را در مدل های هوش مصنوعی مولد ایجاد کرد


هوش مصنوعی مولد جهان را با توانایی خود در تولید فوری متن فوق‌العاده قانع کننده در پاسخ به چند درخواست کاربر شگفت‌زده کرد. در حالی که این شاهکار برای ایجاد یک ماشین تبلیغاتی پس از معرفی ChatGPT یک سال و نیم پیش کافی بود، این قابلیت واحد به طور کامل عمق و وسعت استفاده از هوش مصنوعی مولد را در دنیای واقعی امروزی نشان نمی‌دهد. همچنین یک دیدگاه بسیار تقلیل‌دهنده از اهمیت مجموعه داده‌های تخصصی و تخصص انسانی در هنگام توسعه مدل‌ها و برنامه‌های کاربردی هوش مصنوعی ایجاد می‌کند.

پیشرفت اصلی که به هوش مصنوعی مولد اجازه می دهد تا به سرعت متن را تفسیر و تولید کند، کاملاً الگوریتمی است. این مدل‌های زبان بزرگ (LLM) احتمال آماری یک کلمه را به دنبال کلمه دیگر تعیین می‌کنند تا در نهایت متن منسجم و حالت‌های دیگر را نیز تولید کنند. در حالی که این برای برخی از وظایف تولید محتوای نوشتاری مانند کدنویسی یا پاسخ به سؤالات دانش عمومی عالی است، بسیاری از مدل‌ها هنگام تفسیر نکات ظریف و قضاوت در طول مسیر با مشکل مواجه هستند.

نامه قانون

این یک چالش به ویژه در حوزه ای مانند قانون است، جایی که درک پیشینه حقوقی مربوطه نه تنها به کلمات، بلکه به ساختار پرونده، صلاحیت قضایی و حتی جزئیاتی مانند قاضی خاص که رئیس آن است نیز نیاز دارد.

مرتبط:از آزمایش تا به حداکثر رساندن بازگشت سرمایه با یکپارچه سازی هوش مصنوعی استراتژیک

به عنوان مثال، یک پروژه تحقیقاتی حقوقی را در نظر بگیرید که بر ایجاد سابقه مرتبط برای دفاع از حق ثبت اختراع موفق متمرکز است. یک شمارش پرونده ساده و تجزیه و تحلیل تصمیم برای ردیابی قانون مالکیت معنوی در پنج سال گذشته نشان می دهد که تعداد بسیار زیادی از پرونده های ثبت اختراع در منطقه غربی تگزاس محاکمه شده و با موفقیت از آنها دفاع شده است. در واقع، آن تحقیق نشان خواهد داد که بین سال های 2018 و 2020، برخی از 2400 پرونده ثبت اختراع در دادگاه محاکمه شدند، همه زیر نظر یک قاضی دوستدار ثبت اختراع. تنها در سال 2020، دادگاه 20 درصد از کل پرونده های ثبت اختراع را در ایالات متحده مشاهده کرد و بسیاری از آنها منجر به تصمیمات مطلوب برای شاکیان شد.

بر اساس این اطلاعات، محققی با تکیه بر ابزار اصلی جستجوی هوش مصنوعی مولد که در حال بررسی داده‌های در دسترس عمومی برای اطلاعات بینش است، به این باور می‌رسد که Waco، TX مکان بهینه برای دفاع از حق ثبت اختراع است. با این حال، آنچه ممکن است آن نتایج را از دست داده باشد، دستور 25 ژوئیه 2022 اورلاندو گارسیا، رئیس قاضی ناحیه ایالات متحده برای معرفی قوانین جدید برای پرونده های ثبت اختراع در ناحیه غربی تگزاس است. قابل ذکر است، این قوانین جدید پرونده های ثبت اختراع در منطقه را بین سایر قضات توزیع کرد و عملاً به سلطنت Waco به عنوان پایتخت دفاع از پتنت کشور پایان داد.

مرتبط:شخصی سازی رانندگی در رسانه و سرگرمی

فراتر از مدل های زبان بزرگ بازار انبوه

برای رسیدن به آن سطح از تخصص و تفاوت های ظریف دامنه خاص، ابزارهای هوش مصنوعی مولد که برای کارهای حرفه ای طراحی شده اند، مانند تحقیقات حقوقی، باید از LLM های خارج از قفسه فراتر بروند. در حالی که این مدل‌ها نقطه شروع حیاتی برای ساخت زیرساخت‌های هوش مصنوعی مولد هستند و در تولید نتایج سطح پایه خوب هستند، وقتی صحبت از تنظیم دقیق و بهینه‌سازی آن نتایج برای کارهای بسیار تخصصی می‌شود، باید با ترکیبی تقویت شوند. مدل‌های کوچک‌تر، مدل‌های غیرمولد و مجموعه داده‌های اختصاصی که توسط متخصصان برای تولید نتایج قابل اعتماد و دقیق تنظیم شده‌اند.

با این حال، درست کردن این طرح رقص بین مدل‌ها و مجموعه داده‌ها، به چیزی بیش از اعمال یک چارچوب تولید افزوده بازیابی (RAG) برای مجموعه گسترده‌ای از مجموعه‌های داده نیاز دارد. برای هم‌تراز کردن مدل‌ها، ساختار و نمایه‌سازی داده‌های مورد نیاز برای پشتیبانی از موارد استفاده و تطبیق و محدود کردن آن‌ها به موارد استفاده خاص، به تنظیمات دقیق زیادی نیاز دارد. اینجاست که تخصص انسانی حیاتی است. ویراستاران وکلا با رعایت مثال تحقیقات حقوق ثبت اختراع، هنر حاشیه نویسی و برچسب گذاری متون قانونی را برای بخش بهتری از 150 سال اصلاح کرده اند و می دانند که اعداد اصلی مانند شمارش پرونده های خام و تصمیم گیری ها همیشه برای آشکار کردن آنچه واقعاً در جریان است کافی نیستند. در یک موضوع حقوقی خاص آنها می‌دانند که قانون ثبت اختراع می‌تواند پیچیده باشد و می‌دانند که به جزئیات پیرامون یک روند نگاه کنند، نه فقط به نتایج.

این دانش دامنه را نمی توان هنگام برنامه نویسی و آزمایش مدل های هوش مصنوعی مولد برای ارائه نتایج بسیار مناسب نادیده گرفت. همچنین گامی حیاتی برای از بین بردن خطرات احتمالی این فناوری است.

نوآوری، نه اتوماسیون

انسان هایی که بدون بهره مندی از فناوری تحقیقات انجام می دهند، اغلب درک خود از یک موضوع را با جمع آوری هر نقطه داده جدید شکل می دهند. با این حال، ساختن آن نوع تصویر کامل از طریق کاوش در این مسیرهای مختلف، از جمله برخی بن‌بست‌ها، زمان بسیار زیادی و تفکر خلاقانه می‌طلبد. جایی که هوش مصنوعی مولد می تواند بیشتر کمک کند نه با جایگزینی یا حذف آن فرآیند، بلکه با اجازه دادن به این مسیرها برای کاوش سریعتر و خودکارتر، در نتیجه تصویر کامل تری با دیدگاه های جایگزین به مردم ارائه می دهد. هنگامی که محققان بتوانند با اطمینان از اینکه با بالاترین استانداردهای دقت و مسئولیت توسعه یافته اند به آن نتایج سریعتر دسترسی پیدا کنند، پتانسیل عملا نامحدود است.

بسیاری از مفسران انقلاب مولد هوش مصنوعی به سرعت هوش مصنوعی را با اتوماسیون ترکیب کردند. و این دقیقاً همان کاری است که برخی از اولین ابزارهای هوش مصنوعی مولد در دسترس عموم انجام دادند – آنها به طور خودکار چیزهایی را نوشتند و به طور خودکار تصاویر تولید کردند. با این حال، این بالاترین درخواست برای این فناوری نیست. هوش مصنوعی مولد که در بالاترین شکل خود کار می‌کند، دستیاری است که می‌تواند به انسان‌ها کمک کند تا اطلاعات بیشتری را بیش از هر زمان دیگری بررسی و بررسی کنند و به تخصص و خلاقیت منحصربه‌فرد انسانی شکوفا شوند.





منبع: https://aibusiness.com/nlp/more-than-words-how-to-build-human-expertise-into-generative-ai-models