مدل های هوش مصنوعی را با داده های خود آموزش دهید تا خطرات را کاهش دهید
به گزارش مجله هشت پیک مدل های هوش مصنوعی را با داده های خود آموزش دهید تا خطرات را کاهش دهید
که در این بخش به محتوای این خبر با شما کاربران گرامی خواهیم پرداخت
سازمانهایی که میخواهند از هوش مصنوعی مولد (AI) به طور مؤثرتری استفاده کنند، باید از دادههای خود برای آموزش سیستمهای هوش مصنوعی استفاده کنند و از مدلهای پایه به عنوان نقطه شروع استفاده کنند.
انجام این کار میتواند زمینه مرتبطتری را فراهم کند و نگرانیها در مورد خطرات احتمالی، مانند عدم دقت و نقض مالکیت معنوی را برطرف کند.
همچنین: نحوه استفاده از ChatGPT: همه چیزهایی که باید بدانید
دقت، به ویژه، اولویت اصلی شرکتی مانند Jiva است. فروشنده agritech از هوش مصنوعی برای تقویت برنامه موبایل خود، Crop Doctor استفاده می کند، که بیماری های محصول را از طریق پردازش تصویر و بینایی کامپیوتری شناسایی می کند و درمان هایی را توصیه می کند. همچنین برای تعیین شایستگی اعتباری کشاورزانی که پیش از برداشت محصول درخواست پیش پرداخت نقدی میکنند، از هوش مصنوعی استفاده میکند و پس از پرداخت محصول، وامها را برمیگرداند.
این ابزار از هوش مصنوعی و ابزارهای یادگیری ماشینی مختلف، از جمله Pinecorn، OpenAI، و scikit-learn، و همچنین TensorFlow و Vertex AI گوگل استفاده میکند. جیوا در سنگاپور، اندونزی و هند فعالیت دارد.
به گفته تجاس دینکار، مدیر ارشد فناوری Jiva، این مدلهای هوش مصنوعی خود را بر روی هزاران تصویر حاشیهنویسی برای هر بیماری آموزش میدهد. شرکت agritech صدها هزار تصویر را از طریق تیم های میدانی خود و کشاورزانی که بخشی از شبکه Jiva هستند و از برنامه AgriCentral آن که در هند موجود است استفاده می کنند، جمع آوری کرده است.
همچنین: نحوه استفاده از Bing Image Creator (و چرا بهتر از DALL-E 2)
کارشناسان میدانی آن در جمع آوری اولیه و حاشیه نویسی تصاویر شرکت دارند، قبل از اینکه این تصاویر به کارشناسان زراعت منتقل شود تا تصاویر را بیشتر حاشیه نویسی کنند. اینها سپس به مدل آموزشی مورد استفاده برای شناسایی بیماری گیاهی اضافه می شوند.
برای محصولات جدید یا محصولاتی که تیم متخصصانش کمتر با آنها آشنا هستند، Jiva پلتفرم های دیگری مانند Plantix را ارائه می کند که دارای مجموعه داده های گسترده ای برای تشخیص تصویر و اطلاعات تشخیص است.
دینکار در مصاحبه ای با مجله هشت پیک گفت که ارائه اطلاعات دقیق حیاتی است زیرا داده ها می توانند برداشت و معیشت کشاورزان را بهبود بخشند. برای اطمینان بیشتر از صحت داده ها، هوش مصنوعی مولد و مدل های زبان بزرگ (LLM) تنها از مجموعه داده هایی استفاده می کنند که خود جیوا منبع و بررسی شده است.
او گفت که علاوه بر این از چت بات خواسته شده است که از طریق مهندسی سریع، هر گونه داده از پیش آموزش دیده در مورد کشاورزی را که ممکن است در LLM ها وجود داشته باشد، نادیده بگیرد.
همچنین: این سیستم هوش مصنوعی جدید می تواند حدود نیمی از زمان ذهن ها را با دقت بخواند
اگر دادهای برای استخراج وجود نداشته باشد، ربات چت پاسخی را برمیگرداند که میگوید قادر به شناسایی بیماری محصول نیست. او گفت: “شما می خواهید اطمینان حاصل کنید که داده های کافی وجود دارد. ما نمی خواهیم پاسخ مبهم ارائه کنیم.”
Jiva همچنین از کتابخانه تصویر خود برای ساخت بر روی پلتفرم هایی مانند Plantix استفاده می کند. دینکار گفت که این مدلها خط پایه خوبی را ارائه میکنند، اما از آنجایی که توسط شرکتهای جهانی توسعه داده میشوند، ممکن است لزوماً به اندازه کافی بر روی دادههای خاص یک منطقه یا بازار آموزش داده نشده باشند.
او گفت که این موضوع به این معنی بود که Jiva مجبور بود برای محصولاتی که در اندونزی و هند رایجتر بودند، مانند ذرت، مدلهای آموزشی ایجاد کند. او با اشاره به اهمیت بومیسازی در مدلهای هوش مصنوعی افزود، این محصولات بهتر از Plantix یا سایر محصولات تولید شده عمل میکنند.
مدل های پایه دقیق برای گرفتن نتایج بهتر
استفاده از مدلهای داده پایه یک راه برای شروع سریع با هوش مصنوعی مولد است. با این حال، به گفته اولیویه کلاین، کارشناس ارشد خدمات وب آمازون (AWS) آسیا و اقیانوسیه، یک چالش رایج با این رویکرد این است که داده ها ممکن است به صنعتی که در آن کسب و کار در آن فعالیت می کند، مرتبط نباشد.
کلاین گفت که برای موفقیت در استقرار هوش مصنوعی مولد خود، سازمان ها باید مدل هوش مصنوعی را با داده های خود به خوبی تنظیم کنند. شرکت هایی که تلاش می کنند تا این کار را به درستی انجام دهند، با اجرای خود سریعتر پیش خواهند رفت.
همچنین: این کارشناسان برای محافظت از هوش مصنوعی در برابر هکرها مسابقه می دهند
او افزود که استفاده از هوش مصنوعی مولد به تنهایی اگر در استراتژی داده و پلتفرم سازمان تعبیه شود، قانعکنندهتر خواهد بود.
او گفت که بسته به مورد استفاده، چالش رایجی که شرکتها با آن روبرو هستند این است که آیا دادههای کافی برای آموزش مدل هوش مصنوعی دارند یا خیر. با این حال، وی خاطرنشان کرد که کمیت داده ها لزوماً با کیفیت داده برابر نیست.
او گفت که حاشیه نویسی داده ها نیز مهم است، همانطور که زمینه را برای مدل های آموزشی هوش مصنوعی به کار می برد، بنابراین سیستم پاسخ هایی را ارائه می دهد که بیشتر مختص صنعت کسب و کار است.
با حاشیهنویسی دادهها، اجزای جداگانه دادههای آموزشی برچسبگذاری میشوند تا ماشینهای هوش مصنوعی بتوانند بفهمند دادهها شامل چه چیزهایی هستند و چه اجزایی مهم هستند.
کلاین به یک تصور غلط رایج اشاره کرد که همه سیستم های هوش مصنوعی یکسان هستند، که اینطور نیست. او مجدداً بر لزوم سازمانها برای اطمینان از تغییر مدلهای هوش مصنوعی بر اساس موارد استفاده و همچنین عمودی آنها تأکید کرد.
او گفت که LLM ها گفتگوهای زیادی را در میان مشتریان سازمانی در مورد استفاده از هوش مصنوعی مولد در مراکز تماس، به ویژه، به راه انداخته اند. علاقهای به این موضوع وجود دارد که چگونه این فناوری میتواند تجربه را برای نمایندگان تماس افزایش دهد، کسانی که میتوانند به پاسخهای بهتر در حین پرواز دسترسی داشته باشند و آنها را برای بهبود خدمات مشتری ترکیب کنند.
او خاطرنشان کرد که اپراتورهای مرکز تماس می توانند مدل هوش مصنوعی را با استفاده از پایگاه دانش خود، که می تواند شامل چت بات و تعامل با مشتری باشد، آموزش دهند.
طبق گزارش Business Harvard Review، افزودن محتوای خاص دامنه به یک LLM موجود که قبلاً بر روی دانش عمومی و تعامل مبتنی بر زبان آموزش دیده است، معمولاً به دادههای بسیار کمتری نیاز دارد. این رویکرد تنظیم دقیق شامل تنظیم برخی پارامترهای یک مدل پایه است و فقط از صدها یا هزاران سند استفاده می کند، نه میلیون ها یا میلیاردها. زمان محاسباتی کمتری نیز در مقایسه با ساخت یک مدل پایه جدید از زمین صفر مورد نیاز است.
همچنین: بر اساس این مطالعه، هوش مصنوعی مولد میتواند برخی از کارگران را بسیار بهرهورتر کند
هرچند محدودیت هایی وجود دارد. این گزارش خاطرنشان کرد که این رویکرد هنوز هم می تواند گران باشد و به تخصص علم داده نیاز دارد. علاوه بر این، همه ارائهدهندگان LLM، مانند ChatGPT-4 OpenAi، به کاربران اجازه نمیدهند که در بالای برنامههای خود تنظیم دقیق کنند.
کلاین گفت، بهره برداری از داده های خود همچنین نگرانی مشترک مشتریان را در میان علاقه شدید به هوش مصنوعی مولد برطرف می کند، جایی که کسب و کارها می خواهند کنترل داده های مورد استفاده برای آموزش مدل های هوش مصنوعی را حفظ کنند و داده ها در محیط آنها باقی بماند.
او خاطرنشان کرد: این رویکرد تضمین می کند که هیچ “جعبه سیاه” وجود ندارد و سازمان دقیقاً می داند که از چه داده هایی برای تغذیه مدل هوش مصنوعی استفاده می شود. همچنین شفافیت را تضمین می کند و به ایجاد مسئولیت پذیری هوش مصنوعی کمک می کند.
او گفت همچنین تلاشهای مداومی برای شناسایی سیاستهای مورد نیاز برای جلوگیری از اثر جعبه سیاه وجود دارد و افزود که AWS با تنظیمکنندهها و سیاستگذاران برای اطمینان از سازگاری محصولات هوش مصنوعی خود کار میکند. این شرکت همچنین به مشتریان کمک می کند تا با پیاده سازی های خود نیز همین کار را انجام دهند.
همچنین: مردم اکنون برای عیب یابی مشکلات فنی خود به ChatGPT روی می آورند
او گفت، برای مثال، آمازون بستر میتواند سوگیری را تشخیص دهد و محتوایی را که دستورالعملهای اخلاقی هوش مصنوعی را نقض میکند، فیلتر کند. Bedrock مجموعهای از مدلهای پایه است که شامل مدلهای اختصاصی و همچنین مدلهای صنعتی مانند Amazon Titan، Jurassic-2 آزمایشگاههای AI21، Claude Anthropic و Stability AI است.
کلاین پیشبینی میکند که مدلهای داده پایه بیشتری در آینده پدیدار شوند، از جمله مدلهای پایه عمودی خاص، تا سازمانها را با گزینههای بیشتر آموزش دهند.
مشکلات کلیدی برای حل با هوش مصنوعی مولد
در جایی که مدلهای هوش مصنوعی قوی وجود نداشته باشد، انسانها میتوانند پا پس بگذارند.
دینکار برای مسائل نادر یا بسیار خاص محصول، خاطرنشان کرد که تیم متخصصان زراعت Jiva می توانند با محققان محلی و تیم های میدانی برای حل آنها همکاری کنند.
او گفت که تیم ارزیابی اعتبار این شرکت همچنین داده های تولید شده توسط سیستم های هوش مصنوعی را با اطلاعات دیگر پوشش می دهد. برای مثال، تیم ممکن است یک بازدید در محل انجام دهد و متوجه شود که یک محصول اخیراً برای برداشت آماده شده است، که سیستم مجهز به هوش مصنوعی ممکن است در هنگام ایجاد ارزیابی اعتبار آن را در نظر نگرفته باشد.
“هدف حذف کامل انسان ها نیست، بلکه انتقال آنها به مناطقی است که می توانند تقویت کنند و [apply] دینکار گفت: افکار تطبیقی، که ماشینها هنوز به آنها نرسیدهاند.
در پاسخ به سوالی درباره چالشهایی که Jiva در استفاده از هوش مصنوعی مولد خود با آن مواجه شد، به فقدان یک روش استاندارد سریع در بین نسخههای مختلف نرمافزار و ارائهدهندگان اشاره کرد.
او گفت که “همه زبان گرایی واقعی” نیز در LLM وجود ندارد، در حالی که توهم همچنان یک مسئله کلیدی است.
«مدلهای مختلف زبان بزرگ همگی ویژگیهای خاص خود را دارند [and] همان تکنیکهای سریع در این موارد کار نمیکنند.” او توضیح داد. به عنوان مثال، از طریق مهندسی سریع پیشرفته، Jiva توانسته است به ربات کشاورزی خود دستور دهد تا روشن کند که آیا قادر به استنتاج از زمینه، محصولی است که کشاورز به آن اشاره میکند یا خیر. .
همچنین: چگونه ChatGPT را فریب دادم تا به من دروغ بگوید
با این حال، او گفت، در حالی که این دستور خاص در GPT-3.5 عملکرد خوبی داشت، اما در GPT-4 به خوبی عمل نکرد. همچنین در LLM متفاوت کار نمی کند.
دینکار گفت: «ناتوانی در استفاده مجدد از درخواستها در سراسر نسخهها و پلتفرمها، ایجاد مجموعههای سفارشی از تکنیکهای سریع برای هر یک را ضروری میکند. “با بهبود ابزارها و ظهور بهترین روش ها برای ایجاد مدل های مختلف زبانی بزرگ، امیدواریم درخواست های چند پلتفرمی به واقعیت تبدیل شوند.”
او گفت که در پشتیبانی بین زبانی نیز به بهبودهایی نیاز است و به پاسخ های عجیبی که ربات چت آن گاهی اوقات خارج از زمینه ایجاد می کند اشاره کرد.
امیدواریم از این مقاله مجله هشت پیک نیز استفاده لازم را کرده باشید و در صورت تمایل آنرا با دوستان خود به اشتراک بگذارید و با امتیاز از قسمت پایین و درج نظرات باعث دلگرمی مجموعه مجله 8pic باشید
لینک کوتاه مقاله : https://5ia.ir/GZNEID
کوتاه کننده لینک
کد QR :
آخرین دیدگاهها