مدل های هوش مصنوعی را با داده های خود آموزش دهید تا خطرات را کاهش دهید

توسط 8pic · 23 تیر 1402

زمان مطالعه: 7 دقیقه

به گزارش مجله هشت پیک مدل های هوش مصنوعی را با داده های خود آموزش دهید تا خطرات را کاهش دهید
که در این بخش به محتوای این خبر با شما کاربران گرامی خواهیم پرداخت

شخصی که از هوش مصنوعی روی لپ تاپ استفاده می کند — Vithun Khamsong/Getty Images

سازمان‌هایی که می‌خواهند از هوش مصنوعی مولد (AI) به طور مؤثرتری استفاده کنند، باید از داده‌های خود برای آموزش سیستم‌های هوش مصنوعی استفاده کنند و از مدل‌های پایه به عنوان نقطه شروع استفاده کنند.

انجام این کار می‌تواند زمینه مرتبط‌تری را فراهم کند و نگرانی‌ها در مورد خطرات احتمالی، مانند عدم دقت و نقض مالکیت معنوی را برطرف کند.

همچنین: نحوه استفاده از ChatGPT: همه چیزهایی که باید بدانید

دقت، به ویژه، اولویت اصلی شرکتی مانند Jiva است. فروشنده agritech از هوش مصنوعی برای تقویت برنامه موبایل خود، Crop Doctor استفاده می کند، که بیماری های محصول را از طریق پردازش تصویر و بینایی کامپیوتری شناسایی می کند و درمان هایی را توصیه می کند. همچنین برای تعیین شایستگی اعتباری کشاورزانی که پیش از برداشت محصول درخواست پیش پرداخت نقدی می‌کنند، از هوش مصنوعی استفاده می‌کند و پس از پرداخت محصول، وام‌ها را برمی‌گرداند.

این ابزار از هوش مصنوعی و ابزارهای یادگیری ماشینی مختلف، از جمله Pinecorn، OpenAI، و scikit-learn، و همچنین TensorFlow و Vertex AI گوگل استفاده می‌کند. جیوا در سنگاپور، اندونزی و هند فعالیت دارد.

به گفته تجاس دینکار، مدیر ارشد فناوری Jiva، این مدل‌های هوش مصنوعی خود را بر روی هزاران تصویر حاشیه‌نویسی برای هر بیماری آموزش می‌دهد. شرکت agritech صدها هزار تصویر را از طریق تیم های میدانی خود و کشاورزانی که بخشی از شبکه Jiva هستند و از برنامه AgriCentral آن که در هند موجود است استفاده می کنند، جمع آوری کرده است.

همچنین: نحوه استفاده از Bing Image Creator (و چرا بهتر از DALL-E 2)

کارشناسان میدانی آن در جمع آوری اولیه و حاشیه نویسی تصاویر شرکت دارند، قبل از اینکه این تصاویر به کارشناسان زراعت منتقل شود تا تصاویر را بیشتر حاشیه نویسی کنند. اینها سپس به مدل آموزشی مورد استفاده برای شناسایی بیماری گیاهی اضافه می شوند.

برای محصولات جدید یا محصولاتی که تیم متخصصانش کمتر با آنها آشنا هستند، Jiva پلتفرم های دیگری مانند Plantix را ارائه می کند که دارای مجموعه داده های گسترده ای برای تشخیص تصویر و اطلاعات تشخیص است.

دینکار در مصاحبه ای با مجله هشت پیک گفت که ارائه اطلاعات دقیق حیاتی است زیرا داده ها می توانند برداشت و معیشت کشاورزان را بهبود بخشند. برای اطمینان بیشتر از صحت داده ها، هوش مصنوعی مولد و مدل های زبان بزرگ (LLM) تنها از مجموعه داده هایی استفاده می کنند که خود جیوا منبع و بررسی شده است.

او گفت که علاوه بر این از چت بات خواسته شده است که از طریق مهندسی سریع، هر گونه داده از پیش آموزش دیده در مورد کشاورزی را که ممکن است در LLM ها وجود داشته باشد، نادیده بگیرد.

همچنین: این سیستم هوش مصنوعی جدید می تواند حدود نیمی از زمان ذهن ها را با دقت بخواند

اگر داده‌ای برای استخراج وجود نداشته باشد، ربات چت پاسخی را برمی‌گرداند که می‌گوید قادر به شناسایی بیماری محصول نیست. او گفت: “شما می خواهید اطمینان حاصل کنید که داده های کافی وجود دارد. ما نمی خواهیم پاسخ مبهم ارائه کنیم.”

Jiva همچنین از کتابخانه تصویر خود برای ساخت بر روی پلتفرم هایی مانند Plantix استفاده می کند. دینکار گفت که این مدل‌ها خط پایه خوبی را ارائه می‌کنند، اما از آنجایی که توسط شرکت‌های جهانی توسعه داده می‌شوند، ممکن است لزوماً به اندازه کافی بر روی داده‌های خاص یک منطقه یا بازار آموزش داده نشده باشند.

او گفت که این موضوع به این معنی بود که Jiva مجبور بود برای محصولاتی که در اندونزی و هند رایج‌تر بودند، مانند ذرت، مدل‌های آموزشی ایجاد کند. او با اشاره به اهمیت بومی‌سازی در مدل‌های هوش مصنوعی افزود، این محصولات بهتر از Plantix یا سایر محصولات تولید شده عمل می‌کنند.

شاید این مقاله را هم دوست داشته باشید : آموزش رایگان ارسال عکس با کیفیت اصلی و بالا در واتساپ

مدل های پایه دقیق برای گرفتن نتایج بهتر

استفاده از مدل‌های داده پایه یک راه برای شروع سریع با هوش مصنوعی مولد است. با این حال، به گفته اولیویه کلاین، کارشناس ارشد خدمات وب آمازون (AWS) آسیا و اقیانوسیه، یک چالش رایج با این رویکرد این است که داده ها ممکن است به صنعتی که در آن کسب و کار در آن فعالیت می کند، مرتبط نباشد.

کلاین گفت که برای موفقیت در استقرار هوش مصنوعی مولد خود، سازمان ها باید مدل هوش مصنوعی را با داده های خود به خوبی تنظیم کنند. شرکت هایی که تلاش می کنند تا این کار را به درستی انجام دهند، با اجرای خود سریعتر پیش خواهند رفت.

همچنین: این کارشناسان برای محافظت از هوش مصنوعی در برابر هکرها مسابقه می دهند

او افزود که استفاده از هوش مصنوعی مولد به تنهایی اگر در استراتژی داده و پلتفرم سازمان تعبیه شود، قانع‌کننده‌تر خواهد بود.

او گفت که بسته به مورد استفاده، چالش رایجی که شرکت‌ها با آن روبرو هستند این است که آیا داده‌های کافی برای آموزش مدل هوش مصنوعی دارند یا خیر. با این حال، وی خاطرنشان کرد که کمیت داده ها لزوماً با کیفیت داده برابر نیست.

او گفت که حاشیه نویسی داده ها نیز مهم است، همانطور که زمینه را برای مدل های آموزشی هوش مصنوعی به کار می برد، بنابراین سیستم پاسخ هایی را ارائه می دهد که بیشتر مختص صنعت کسب و کار است.

با حاشیه‌نویسی داده‌ها، اجزای جداگانه داده‌های آموزشی برچسب‌گذاری می‌شوند تا ماشین‌های هوش مصنوعی بتوانند بفهمند داده‌ها شامل چه چیزهایی هستند و چه اجزایی مهم هستند.

کلاین به یک تصور غلط رایج اشاره کرد که همه سیستم های هوش مصنوعی یکسان هستند، که اینطور نیست. او مجدداً بر لزوم سازمان‌ها برای اطمینان از تغییر مدل‌های هوش مصنوعی بر اساس موارد استفاده و همچنین عمودی آنها تأکید کرد.

او گفت که LLM ها گفتگوهای زیادی را در میان مشتریان سازمانی در مورد استفاده از هوش مصنوعی مولد در مراکز تماس، به ویژه، به راه انداخته اند. علاقه‌ای به این موضوع وجود دارد که چگونه این فناوری می‌تواند تجربه را برای نمایندگان تماس افزایش دهد، کسانی که می‌توانند به پاسخ‌های بهتر در حین پرواز دسترسی داشته باشند و آنها را برای بهبود خدمات مشتری ترکیب کنند.

او خاطرنشان کرد که اپراتورهای مرکز تماس می توانند مدل هوش مصنوعی را با استفاده از پایگاه دانش خود، که می تواند شامل چت بات و تعامل با مشتری باشد، آموزش دهند.

طبق گزارش Business Harvard Review، افزودن محتوای خاص دامنه به یک LLM موجود که قبلاً بر روی دانش عمومی و تعامل مبتنی بر زبان آموزش دیده است، معمولاً به داده‌های بسیار کمتری نیاز دارد. این رویکرد تنظیم دقیق شامل تنظیم برخی پارامترهای یک مدل پایه است و فقط از صدها یا هزاران سند استفاده می کند، نه میلیون ها یا میلیاردها. زمان محاسباتی کمتری نیز در مقایسه با ساخت یک مدل پایه جدید از زمین صفر مورد نیاز است.

همچنین: بر اساس این مطالعه، هوش مصنوعی مولد می‌تواند برخی از کارگران را بسیار بهره‌ورتر کند

هرچند محدودیت هایی وجود دارد. این گزارش خاطرنشان کرد که این رویکرد هنوز هم می تواند گران باشد و به تخصص علم داده نیاز دارد. علاوه بر این، همه ارائه‌دهندگان LLM، مانند ChatGPT-4 OpenAi، به کاربران اجازه نمی‌دهند که در بالای برنامه‌های خود تنظیم دقیق کنند.

کلاین گفت، بهره برداری از داده های خود همچنین نگرانی مشترک مشتریان را در میان علاقه شدید به هوش مصنوعی مولد برطرف می کند، جایی که کسب و کارها می خواهند کنترل داده های مورد استفاده برای آموزش مدل های هوش مصنوعی را حفظ کنند و داده ها در محیط آنها باقی بماند.

شاید این مقاله را هم دوست داشته باشید : 5 ابزار مفید هوش مصنوعی برای استفاده در کار و زندگی روزمره

او خاطرنشان کرد: این رویکرد تضمین می کند که هیچ “جعبه سیاه” وجود ندارد و سازمان دقیقاً می داند که از چه داده هایی برای تغذیه مدل هوش مصنوعی استفاده می شود. همچنین شفافیت را تضمین می کند و به ایجاد مسئولیت پذیری هوش مصنوعی کمک می کند.

او گفت همچنین تلاش‌های مداومی برای شناسایی سیاست‌های مورد نیاز برای جلوگیری از اثر جعبه سیاه وجود دارد و افزود که AWS با تنظیم‌کننده‌ها و سیاست‌گذاران برای اطمینان از سازگاری محصولات هوش مصنوعی خود کار می‌کند. این شرکت همچنین به مشتریان کمک می کند تا با پیاده سازی های خود نیز همین کار را انجام دهند.

همچنین: مردم اکنون برای عیب یابی مشکلات فنی خود به ChatGPT روی می آورند

او گفت، برای مثال، آمازون بستر می‌تواند سوگیری را تشخیص دهد و محتوایی را که دستورالعمل‌های اخلاقی هوش مصنوعی را نقض می‌کند، فیلتر کند. Bedrock مجموعه‌ای از مدل‌های پایه است که شامل مدل‌های اختصاصی و همچنین مدل‌های صنعتی مانند Amazon Titan، Jurassic-2 آزمایشگاه‌های AI21، Claude Anthropic و Stability AI است.

کلاین پیش‌بینی می‌کند که مدل‌های داده پایه بیشتری در آینده پدیدار شوند، از جمله مدل‌های پایه عمودی خاص، تا سازمان‌ها را با گزینه‌های بیشتر آموزش دهند.

مشکلات کلیدی برای حل با هوش مصنوعی مولد

در جایی که مدل‌های هوش مصنوعی قوی وجود نداشته باشد، انسان‌ها می‌توانند پا پس بگذارند.

دینکار برای مسائل نادر یا بسیار خاص محصول، خاطرنشان کرد که تیم متخصصان زراعت Jiva می توانند با محققان محلی و تیم های میدانی برای حل آنها همکاری کنند.

او گفت که تیم ارزیابی اعتبار این شرکت همچنین داده های تولید شده توسط سیستم های هوش مصنوعی را با اطلاعات دیگر پوشش می دهد. برای مثال، تیم ممکن است یک بازدید در محل انجام دهد و متوجه شود که یک محصول اخیراً برای برداشت آماده شده است، که سیستم مجهز به هوش مصنوعی ممکن است در هنگام ایجاد ارزیابی اعتبار آن را در نظر نگرفته باشد.

“هدف حذف کامل انسان ها نیست، بلکه انتقال آنها به مناطقی است که می توانند تقویت کنند و [apply] دینکار گفت: افکار تطبیقی، که ماشین‌ها هنوز به آن‌ها نرسیده‌اند.

در پاسخ به سوالی درباره چالش‌هایی که Jiva در استفاده از هوش مصنوعی مولد خود با آن مواجه شد، به فقدان یک روش استاندارد سریع در بین نسخه‌های مختلف نرم‌افزار و ارائه‌دهندگان اشاره کرد.

او گفت که “همه زبان گرایی واقعی” نیز در LLM وجود ندارد، در حالی که توهم همچنان یک مسئله کلیدی است.

«مدل‌های مختلف زبان بزرگ همگی ویژگی‌های خاص خود را دارند [and] همان تکنیک‌های سریع در این موارد کار نمی‌کنند.” او توضیح داد. به عنوان مثال، از طریق مهندسی سریع پیشرفته، Jiva توانسته است به ربات کشاورزی خود دستور دهد تا روشن کند که آیا قادر به استنتاج از زمینه، محصولی است که کشاورز به آن اشاره می‌کند یا خیر. .

همچنین: چگونه ChatGPT را فریب دادم تا به من دروغ بگوید

با این حال، او گفت، در حالی که این دستور خاص در GPT-3.5 عملکرد خوبی داشت، اما در GPT-4 به خوبی عمل نکرد. همچنین در LLM متفاوت کار نمی کند.

دینکار گفت: «ناتوانی در استفاده مجدد از درخواست‌ها در سراسر نسخه‌ها و پلتفرم‌ها، ایجاد مجموعه‌های سفارشی از تکنیک‌های سریع برای هر یک را ضروری می‌کند. “با بهبود ابزارها و ظهور بهترین روش ها برای ایجاد مدل های مختلف زبانی بزرگ، امیدواریم درخواست های چند پلتفرمی به واقعیت تبدیل شوند.”

او گفت که در پشتیبانی بین زبانی نیز به بهبودهایی نیاز است و به پاسخ های عجیبی که ربات چت آن گاهی اوقات خارج از زمینه ایجاد می کند اشاره کرد.

امیدواریم از این مقاله مجله هشت پیک نیز استفاده لازم را کرده باشید و در صورت تمایل آنرا با دوستان خود به اشتراک بگذارید و با امتیاز از قسمت پایین و درج نظرات باعث دلگرمی مجموعه مجله 8pic باشید