Александр Голубев - Воркшоп по LLM + RLHF
- Для чего нужен RLHF
- Примеры работы модели в диалоговом режиме без SFT и RL fine-tuning
- Как тюнить большие модели на одной карте
- SFT fine-tuning
- Обучение RM
- Дообучение модели с PPO
- Демонстрация результатов было vs стало
- Разбор концепций, которые использовали в ходе обучения (LoRA adapters, Int8 quantization, PPO, RM training loss, …)
Cсылка на ноутбук: https://colab.research.google.com/drive/1RWjffhD6OGj39wKlZvpYGYEEKIeh3EOT?usp=sharing
Data Fest 2023:
https://ods.ai/events/datafestonline2023
Трек "Instruct Models":
https://ods.ai/tracks/df23-instruct-models
Наши соц.сети:
Telegram: https://t.me/datafest
Вконтакте: https://vk.com/datafest
社交媒体聆听
ML System Design - Машинное обучение на практике
Страница курса: https://ods.ai/tracks/ml-system-design-23 Course Fest: https://ods.ai/events/course_season_autumn_23 Наши соц.сети: Как попасть в чат сообщества ODS Mattermost: https://ods.ai/tracks/mattermost Telegram: https://t.me/datafest Вконтакте: https://vk.com/datafest Канал с вакансиями в telegram: https://t.me/odsjobs Канал с апдейтами по курсам: https://t.me/odscourses
Александр Голубев - Воркшоп по LLM + RLHF
- Для чего нужен RLHF - Примеры работы модели в диалоговом режиме без SFT и RL fine-tuning - Как тюнить большие модели на одной карте - SFT fine-tuning - Обучение RM - Дообучение модели с PPO - Демонстрация результатов было vs стало - Разбор концепций, которые использовали в ходе обучения (LoRA adapters, Int8 quantization, PPO, RM training loss, …) Cсылка на ноутбук: https://colab.research.google.com/drive/1RWjffhD6OGj39wKlZvpYGYEEKIeh3EOT?usp=sharing Data Fest 2023: https://ods.ai/events/datafestonline2023 Трек "Instruct Models": https://ods.ai/tracks/df23-instruct-models Наши соц.сети: Telegram: https://t.me/datafest Вконтакте: https://vk.com/datafest
Data Fest 2023, день 4: оффлайн в Питере 23 мая
Data Fest 2023 продолжается! Сегодня вас ждут живые выступления в гостях у работа.ру в Ясной Поляне (СПБ) Информация мероприятие доступна на ODS.AI: https://ods.ai/events/fest2023-spb1 https://ods.ai/events/datafestonline2023 Вступить в сообщество: https://ods.ai/ Соцсети Data Fest & Course Fest: https://t.me/datafest https://vk.com/datafest
总共有 179 条社交媒体数据需要解锁才能查看