نحوه استفاده از زمین بازی OpenAI با GPT-3 و GPT-4

زمان مطالعه: 9 دقیقه

با مجله هشت پیک با مقاله ی نحوه استفاده از زمین بازی OpenAI با GPT-3 و GPT-4
همراه ما باشید

ChatGPT مقدمه‌ای سرگرم‌کننده برای مدل‌های زبان بزرگ (LLM) Transformer Pre-trained Generative (GPT) OpenAI است. اما در حالی که می تواند هوشمندانه و شوخ به نظر برسد، شما واقعاً کنترل زیادی روی خروجی های متن آن ندارید. اگر می‌خواهید با GPT کارهای بیشتری انجام دهید، باید کمی عمیق‌تر بگردید.

می توانید از شخص ثالث استفاده کنید تولید کننده های متن برای دسترسی به API OpenAI، اما آنها دارای معایب و محدودیت های خاص خود هستند. آنها اغلب برای تولید متن پیچیده تر از ChatGPT موثر هستند، اما بیشتر به سمت نوشتن کپی بازاریابی و محتوای وبلاگ – به علاوه، آنها می توانند بسیار گران باشند. و شما هنوز کنترل زیادی در اختیار ندارید.

اگر واقعاً می خواهید ببینید که GPT چه کاری می تواند انجام دهد، باید دستان خود را به درستی کثیف کنید و با API بازی کنید. به این ترتیب، شما واقعاً می توانید اهرم هایی را بکشید که کنترل می کنند GPT چه نوع متنی را می تواند ایجاد کند. در اینجا نحوه انجام این کار آمده است.

توجه داشته باشید: این یک مقاله نسبتاً پیشرفته است که برخی از کنترل‌های فنی GPT-3 و GPT-4 را به تفصیل شرح می‌دهد. من فرض می کنم که هر کسی که این را می خواند درک اولیه ای از آن دارد GPT چیست و آخرین نسل ابزارهای هوش مصنوعی چگونه کار می کنند. اگر این کار را نمی کنید، مقالات لینک شده در بالا را بررسی کنید تا سرعت بیشتری کسب کنید.

نحوه دسترسی به GPT-3 و GPT-4

در حالی که ChatGPT ساده ترین راه برای دسترسی به مدل های GPT است، OpenAI همچنین یک برنامه وب (که آن را زمین بازی می نامد) ارائه می دهد که به شما امکان دسترسی عملی به API در یک برنامه وب زیبا را می دهد. در اینجا به نظر می رسد.

زمین بازی OpenAI

این چیزی است که من قصد دارم از آن برای نمایش موارد در اینجا استفاده کنم، و اگر در این نوع چیزها تازه کار هستید، ارزش بررسی کردن را دارد. فقط برای OpenAI ثبت نام کنید حساب، و سپس به زمین بازی OpenAI.

اگر به دنبال آن هستید ساختن چیزی که از GPT API استفاده می کند، دو گزینه دارید:

  • کدی بنویسید که درخواست ها را به GPT API.

  • استفاده کنید زاپیر برای ارسال خودکار درخواست ها به یکی از GPT API یا ChatGPT بدون استفاده از هیچ کدی

در هر دو مورد، به کنترل‌های مشابه کنترل‌های زیر دسترسی خواهید داشت.

حالا، با فرض اینکه از زمین بازی استفاده می کنید، بیایید وارد زمین شویم.

حالت

گزینه های حالت زمین بازی OpenAI

GPT در حال حاضر دارای سه حالت است:

Chat تنها موردی است که در حال حاضر به‌روزرسانی می‌شود و به آخرین مدل‌های GPT-3.5 Turbo و GPT-4 دسترسی دارد. هم کامل و هم ویرایش در ژوئیه 2023 منسوخ شدند. اگر می‌خواهید با آنها بازی کنید، می‌توانید، اما OpenAI اعلام کرده است که بیشتر منابع خود را برای ادامه توسعه Chat Completions API (که چت از آن استفاده می‌کند) استفاده می‌کند.

به همین دلیل، من بر روی کنترل های موجود برای Chat Completions API تمرکز می کنم.

مدل

گزینه های مدل زمین بازی OpenAI

در حالت چت، شما می توانید از بین چند مدل مختلف GPT انتخاب کنید. همانطور که من این را می نویسم، در اینجا چیزی است که در دسترس است:

  • GPT-3.5-turbo. آخرین نسخه GPT-3.5.

  • GPT-3.5-turbo-16k. آخرین نسخه GPT-3.5 با چهار برابر زمینه (هرچند هزینه استفاده دو برابر بیشتر است).

  • GPT-3.5-turbo-0613. تصویری از GPT-3.5 همانطور که در 13 ژوئن 2023 بود.

  • GPT-3.5-turbo-16k-0613. یک عکس فوری از GPT-3.5 همانطور که در 13 ژوئن 2023 بود، با چهار برابر زمینه (هر چند هزینه استفاده دو برابر بیشتر است).

  • GPT-3.5-turbo-0301. تصویری از GPT-3.5 همانطور که در 1 مارس 2023 بود.

اگر چند ماه دیگر این مطلب را می خوانید، تاریخ های مشخص در مدل های مختلف تغییر می کند، اما ایده ثابت می ماند. آن‌ها عکس‌های فوری ثابتی هستند که هنگام استفاده از GPT اجازه می‌دهند تا حدی ثبات داشته باشند.

GPT-4 نیز از طریق API و زمین بازی در دسترس است، اما برای فعال کردن آن به یک حساب OpenAI نیاز دارید که حداقل یک پرداخت موفقیت آمیز برای استفاده انجام داده باشد (اشتراک ChatGPT Plus حساب نمی شود!).

ساختار سریع

یکی از بزرگترین تفاوت‌ها بین استفاده از ChatGPT و استفاده از Chat Completion API نحوه ساختاربندی دستورات است. با ChatGPT، شما فقط یک پیام ساده ارسال می کنید. می‌توانید هر چقدر که می‌خواهید زمینه را به پیام اضافه کنید، اما ChatGPT فقط باید آن را ادامه دهد.

با Chat Completion API—و از طریق Chat Mode Playground— گزینه دومی را دریافت خواهید کرد. در حالی که شما الف را تعریف می کنید کاربر پیام، شما همچنین می توانید یک نقش برای GPT با استفاده از سیستم پیام

پیام سیستم در زمین بازی OpenAI

به طور پیش‌فرض، این عبارت «شما یک دستیار مفید هستید» خواهد بود، اما می‌توانید از آن برای کنترل نوع پاسخ‌هایی که دریافت می‌کنید استفاده کنید. در اسکرین شات زیر، می‌توانید ببینید که چه اتفاقی می‌افتد وقتی از آن استفاده می‌کنم تا به GPT بگویم جوک بکند.

با استفاده از پیام سیستم در زمین بازی OpenAI به آن بگویید شوخی کند

یا به آن بگویید که مفید نباشد.

استفاده از پیام سیستم در زمین بازی OpenAI برای گفتن آن که مفید نیست

برای بقیه این مقاله، من قصد دارم این را ترک کنم سیستم به عنوان یک دستیار مفید به پیش فرض خود پیام دهید. اما اگر واقعاً می خواهید با کارهایی که GPT می تواند انجام دهد بازی کنید، این یکی از جالب ترین راه هایی است که می توانید انجام دهید.

درجه حرارت

اکنون که اصول اولیه را از سر راه برداشته ایم، بیایید برخی از گزینه های فنی تر را بررسی کنیم. درجه حرارت تصادفی بودن متنی را که GPT تولید می کند کنترل می کند.

LLM ها متنی را بر اساس چیزهایی که در داده های آموزشی خود با آن مواجه شده اند تولید می کنند: هر چه بیشتر با یک عبارت یا مفهوم خاص مواجه شود، احتمال بیشتری وجود دارد که آن را در متنی که تولید می کند گنجانده شود. به همین دلیل است که GPT قادر به ایجاد متنی است که بسیار شبیه به انسان است.

اما بدون درجاتی از تصادفی بودن، GPT تنها می تواند نتایج کاملاً خسته کننده و قابل پیش بینی تولید کند. این به معنای واقعی کلمه فقط محتمل ترین کلمه بعدی را به هر جمله ای اضافه می کند و نتایج آن غیرقابل استفاده خواهد بود. به این دلیل درجه حرارت وجود دارد.

با GPT می توانید a را تنظیم کنید درجه حرارت بین 0 و 2 (پیش فرض 1 است).

در 0، نتایج خسته کننده و قطعی هستند: همان اعلان نتایج تقریباً یکسانی به شما می دهد. وقتی از GPT می‌پرسم خلاقیت در چیست، این اتفاق می‌افتد درجه حرارت روی 0 تنظیم کنید.

زمین بازی OpenAI با دمای تنظیم شده روی 0

و وقتی چند دقیقه بعد دوباره این کار را انجام دادم – یکسان.

زمین بازی OpenAI با دمای تنظیم شده روی 0

با درجه حرارت روی پیش‌فرض 1 تنظیم کنید، مقداری تصادفی می‌بینید اما هیچ چیز خیلی وحشی نیست. در اینجا همان اعلان است درجه حرارت در 1.

OpenAI با دمای تنظیم شده روی 1

و یک بار دیگر

زمین بازی OpenAI با دمای تنظیم شده روی ۱

همانطور که می بینید، GPT به دو روش کاملاً متفاوت پاسخ داده است – اگرچه هر دو کاملاً منسجم هستند.

در نهایت، بیایید ببینیم چه اتفاقی می‌افتد وقتی میل لنگ را می‌چرخانیم درجه حرارت تا 2.

زمین بازی OpenAI با دمای تنظیم شده روی 2

و دوباره.

زمین بازی OpenAI با دمای تنظیم شده روی 2

هرج و مرج کامل در 2، GPT در نهایت کار خود را از دست می دهد و شروع به تف کردن به حرف های بیهوده می کند.

پس این همه به چه معناست؟ اگر از GPT استفاده می کنید، با آن بازی کنید درجه حرارت اگر می خواهید نتایج کم و بیش قابل پیش بینی داشته باشید، اما اگر آن را به سمت افراط و تفریط سوق دهید، انتظار نداشته باشید که اوضاع خوب پیش برود.

حداکثر طول

توکن ها و کاراکترها در OpenAI

GPT متن را به تکه هایی به نام توکن تجزیه می کند. به طور متوسط، هر کدام به حدود چهار کاراکتر از متن نقشه می‌دهند، اگرچه آنها عموماً کلمات کامل هستند. با API، حداکثر طول پارامتر حداکثر تعداد توکن های خروجی را تنظیم می کند. با GPT-3.5، حداکثر مجاز 2048 یا تقریباً 1500 کلمه است.

توجه: هزینه های OpenAI بر اساس استفاده از رمز. در حالی که آنها بسیار ارزان هستند، اگر عادت به تولید خروجی های طولانی با مدل های قوی تر داشته باشید، هزینه ها می تواند افزایش یابد.

توالی ها را متوقف کنید

توالی ها را متوقف کنید برای گفتن زمان توقف تولید خروجی به مدل استفاده می شود. آنها به شما اجازه می دهند که به طور ضمنی طول محتوایی را که تولید می کنید کنترل کنید.

برای مثال، اگر می‌خواهید برای یک سؤال فقط یک جمله پاسخ دهید، می‌توانید از . به عنوان توالی توقف. از طرف دیگر، برای پاسخ یک پاراگراف، می توانید از New Line به عنوان پاسخ استفاده کنید توالی توقف.

توالی ها را در زمین بازی OpenAI متوقف کنید

در حالی که احتمالاً نیازی به استفاده نخواهید داشت توالی ها را متوقف کنید اگر بخواهید یک گفتگو، پرسش و پاسخ یا هر نوع فرمت ساختاریافته دیگری ایجاد کنید، اغلب آنها مفید هستند.

بالا P

بالا P روش دیگری برای کنترل میزان قابل پیش بینی بودن خروجی GPT است. در حالی که درجه حرارت تعیین می کند که مدل به طور تصادفی از لیست کلمات ممکن انتخاب می کند، بالا P طول آن لیست را مشخص می کند.

بیایید بگوییم متن اولیه “هری گینس یک … است” است GPT یک احتمال را به همه توکن های ممکنی که می تواند در اینجا ادامه دهد اختصاص می دهد و رتبه بندی می کند. بیایید بگوییم توزیع چیزی شبیه به این است:

  • 40٪: “نویسنده”

  • 20٪: “فریلنسر”

  • 20%: “عکاس”

  • 10٪: “ایرلندی”

  • 5%: “خنده دار”

  • 4٪: “شوخ”

  • 1٪: “گنوم”

در حالی که به احتمال زیاد برای نویسنده، شغل آزاد یا عکاس تولید می شود، در برخی مواقع می تواند اعلام کند “هری گینس یک آدمک است.”

با یک بالا P از 1، تمام کلمات ممکن GPT گنجانده شده است – حتی آنهایی که بعید هستند. هر چه آن را به 0 نزدیک می کنید، گزینه های بیشتری قطع می شوند. در اسکرین شات زیر می بینید که وقتی روی 0 تنظیم می شود، دقیقاً همان نتایجی را برمی گرداند. درجه حرارت روی 0 تنظیم شد.

زمین بازی OpenAI با Top P روی 0 تنظیم شده است

البته، ریاضیات و مشخصاتی که در این زمینه وجود دارد کمی پیچیده تر است. GPT در بیشتر موارد بیش از هفت توکن را در نظر می گیرد و به این دلیل بالا P وزن گزینه ها را بر اساس احتمال آنها، شماره گیری آن به 0.9 فقط حداقل 10 درصد کلمات را حذف نمی کند، بلکه احتمالاً همه گزینه های تصادفی را حذف می کند.

زمین بازی OpenAI با دمای 1 و Top P در 0.5

در واقع، ساده ترین راه برای درک این موضوع این است که چند دستور را امتحان کنید و با آن بازی کنید.

جریمه فرکانس و جریمه حضور

GPT کارهای زیادی در زیر کاپوت انجام می دهد تا مطمئن شوید که فقط همان متن را بارها و بارها تولید نمی کند. یکی از راه هایی که LLM ها این کار را انجام می دهند، جریمه کردن خودکار نشانه هایی است که قبلاً استفاده شده است. به عنوان مثال، اگر قبلاً از خط “هری گینس یک نویسنده است” استفاده کرده باشد، احتمال بیشتری دارد که دفعه بعد بگوید “هری گینس یک عکاس است” – اگرچه، در واقع، حتی احتمال بیشتری دارد که بگوید “هری یک عکاس است”.

با GPT API، روی دو کنترل پنالتی کنترل دارید: جریمه فرکانس و جریمه حضور. هر دو به طور پیش فرض 0 هستند و حداکثر مقدار آن 2 است.

  • جریمه فرکانس توکن ها را بر اساس تعداد دفعاتی که قبلاً در متن ظاهر شده اند جریمه می کند. هر چه بیشتر ظاهر شوند، بیشتر جریمه می شوند. OpenAI می گوید که این احتمال تکرار کلمه به کلمه خروجی را کاهش می دهد.

  • جریمه حضور نشانه ها را بر اساس اینکه آیا قبلاً در متن ظاهر شده اند جریمه می کند. این یک جریمه ثابت است که OpenAI می گوید خروجی را تشویق می کند تا به سمت موضوعات جدید حرکت کند.

همانطور که احتمالاً از توضیح بالا می توانید درک کنید، این دو کنترل تأثیر کلی تری بر خروجی شما دارند که ممکن است در مقایسه های جانبی به راحتی قابل مشاهده نباشد. با این حال، در اینجا از GPT خواسته می شود تا خورشید را با هر دو پنالتی روی 0 توصیف کند.

زمین بازی OpenAI با هر دو پنالتی 2 تعیین شده است

و اینجاست با جریمه فرکانس روی 2 تنظیم کنید. توجه کنید که تعداد دفعات کمتری خروجی “خورشید” را نشان می دهد.

زمین بازی OpenAI با جریمه فرکانس روی 2 تنظیم شده است

و اینجاست با جریمه حضور روی 2 تنظیم کنید. در حالی که گفتن با اطمینان سخت است، من احساس می کنم این پاسخ گفتمانی تر از دو پاسخ قبلی است.

زمین بازی OpenAI با جریمه حضور 2

با GPT بازی کنید

مانند هر ابزار پیچیده و قدرتمند دیگری، خواندن مقاله‌هایی در مورد نحوه استفاده از کنترل‌های API GPT تنها می‌تواند شما را به این نتیجه برساند. اگر واقعاً می‌خواهید بفهمید که پارامترهای مختلف چه کار می‌کنند، به زمین بازی بروید و همان دستورات را با مقادیر متفاوت برای گزینه‌های مختلف امتحان کنید. دیدن اینکه چقدر خروجی می تواند متفاوت باشد، شگفت انگیز است.

مطالب مرتبط:

امیدواریم از این مقاله مجله هشت پیک نیز استفاده لازم را کرده باشید و در صورت تمایل آنرا با دوستان خود به اشتراک بگذارید و با امتیاز از قسمت پایین و درج نظرات باعث دلگرمی مجموعه مجله 8pic باشید

امتیاز بدهید

لینک کوتاه مقاله : https://5ia.ir/mIAQxo
کوتاه کننده لینک
کد QR :
اشتراک گذاری

شاید این مطالب را هم دوست داشته باشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *