МЕТОДИ ТОНКОГО НАЛАШТУВАННЯ ШТУЧНОГО ІНТЕЛЕКТУ

Автор(и)

  • О. В. Кудрик Вінницький національний технічний університет
  • О. В. Бісікало Вінницький національний технічний університет
  • Ю. С. Здітовецький Вінницький національний технічний університет

DOI:

https://doi.org/10.31649/1997-9266-2024-175-4-139-146

Ключові слова:

методи навчання, штучний інтелект, машинне навчання, моделі, аналіз даних, ChatGPT, тонке налаштування

Анотація

Розглянуто підходи до тонкого налаштування штучного інтелекту на основі двох запропонованих методів. З цією метою проведено огляд основних методів донавчання штучного інтелекту, визначено їхні переваги та недоліки. Запропоновані методи мають свої особливості, кожний з них підходить для різних типів завдань.

Метод «Крок за кроком» базується на поступовому внесенні інформації до моделі ШІ та перевірці засвоєння цієї інформації на кожному етапі навчання. Використовуючи цей підхід, стає можливим виявляти помилки на ранніх стадіях та надавати додаткову інформацію до моделі, що дозволяє штучному інтелекту краще засвоїти матеріал.

У свою чергу, метод «Все одразу» одночасно вносить великий обсяг інформації до моделі ШІ на початковому етапі, після чого розпочинається перевірка засвоєння інформації шляхом постановки запитань. Цей підхід може бути ефективним для завдань, що потребують швидкого навчання та вимагають комплексного розуміння великих обсягів інформації.

Кожен з методів має свої переваги та недоліки, ефективність кожного з них може варіюватися в залежності від конкретного контексту застосування. Метод «Крок за кроком» дозволяє штучному інтелекту краще засвоювати деталі, але може вимагати більше часу та ресурсів. Метод «Все одразу» дозволяє швидше досягати результатів, проте може спричиняти поверхневе розуміння матеріалу та збільшення кількості помилок.

Розроблено блок-схеми кожного з двох методів, проведено порівняльний аналіз ефективності цих методів на прикладі тонкого налаштування моделі ChatGPT. Проведено експериментальну апробацію процесу донавчання ШІ на основі кожного з методів, завдяки чому отримано порівняльну оцінку ефективності результатів тонкого налаштування та дійшли висновків. Результати дослідження можуть бути корисними для розробників та дослідників, які працюють у сфері штучного інтелекту, та можуть допомогти обрати кращий метод донавчання для конкретних завдань.

Отже, досліджено модифіковані методи тонкого налаштування штучного інтелекту, які забезпечують використання меншої кількості ресурсів та отримання високої точності та ефективності роботи для конкретних завдань.

Біографії авторів

О. В. Кудрик, Вінницький національний технічний університет

аспірант кафедри автоматизації та інтелектуальних інформаційних технологій

О. В. Бісікало, Вінницький національний технічний університет

д-р техн. наук, професор, завідувач кафедри автоматизації та інтелектуальних інформаційних технологій

Ю. С. Здітовецький, Вінницький національний технічний університет

аспірант кафедри автоматизації та інтелектуальних інформаційних технологій

Посилання

М. Мар’єнко, і В. Коваленко «Штучний інтелект та відкрита наука в освіті,» Фізико-математична освіта, № 1, с. 48-53, 2023.

N. Lore et al., “Large model strategic thinking, small model efficiency: transferring theory of mind in large language models,” arXiv preprint arXiv:2408.05241, 2024.

J. Cheonsu, “Fine-tuning and utilization methods of domain-specific llms,” arXiv preprint arXiv:2401.02981. 2024.

R. Mathav et al., “Fine tuning llms for enterprise: practical guidelines and recommendations,” arXiv preprint arXiv: 2404.10779, 2024.

H. Sun, “Supervised fine-tuning as inverse reinforcement learning,” arXiv preprint arXiv:2403.12017, 2024.

H. Mentzingen et al., “Textual similarity for legal precedents discovery: Assessing the performance of machine learning techniques in an administrative court,” International Journal of Information Management Data Insights, no. 4(2), p.100247, 2024.

Y. Xie et al., “Active Finetuning: Exploiting Annotation Budget in the Pretraining-Finetuning Paradigm,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 23715-23724, 2023.

Fine-tuning – OpenAI platform. [Electronic resource]. Available: https://platform.openai.com/docs/guides/fine-tuning .

API Reference – OpenAI API. [Electronic resource]. Available: https://platform.openai.com/docs/api-reference .

Oracle APEX Documentation. [Electronic resource]. Available: https://docs.oracle.com/en/database/oracle/apex/index.html .

НМТ онлайн 2024 року з хімії – демоваріант, сайт ЗНО. Освіта.UA. [Електронний ресурс]. Режим доступу: https://zno.osvita.ua/chemistry/574/ .

НМТ онлайн 2024 року з української мови – демоваріант, сайт ЗНО. Освіта.UA. [Електронний ресурс]. Режим доступу: https://zno.osvita.ua/ukrainian/568/ .

ЗНО онлайн 2021 року з географії – основна сесія, сайт ЗНО. Освіта.UA. [Електронний ресурс]. Режим доступу: https://zno.osvita.ua/geography/476/ .

##submission.downloads##

Переглядів анотації: 69

Опубліковано

2024-08-30

Як цитувати

[1]
О. В. Кудрик, О. В. Бісікало, і Ю. С. Здітовецький, «МЕТОДИ ТОНКОГО НАЛАШТУВАННЯ ШТУЧНОГО ІНТЕЛЕКТУ», Вісник ВПІ, вип. 4, с. 139–146, Серп. 2024.

Номер

Розділ

Інформаційні технології та комп'ютерна техніка

Метрики

Завантаження

Дані завантаження ще не доступні.