Подключайтесь к онлайн-семинару по задаче «Уроки настоящего извлечения информации из текста» от Банка ВТБ.
На занятии мы научимся работать с библиотекой Hugging Face. В частности, познакомимся с тем, как устроены языковые модели, что такое токенизация текста и для чего она нужна, рассмотрим несколько подходов к решению задач выделения именованных сущностей (Named Entity Recognition) и отношений (Relation Extraction) с использованием языковых моделей: рассмотрим их как задачу классификации последовательности токенов (Sequence Classification) и как задачу ответа на вопрос по фрагменту текста (Model Reading Comprehension). В конце занятия мы напишем цикл для дообучения языковой (fine-tuning) модели и посмотрим на некоторые техники для эффективной работы с моделями в случае ограниченного количества вычислительных ресурсов.
Дата и время проведения: 13 ноября в 15:00 (МСК)
Спикер: Меркушов Лев Юрьевич, аналитик данных Департамента анализа данных и моделирования (ДАДМ) Банка ВТБ.
Трансляция: https://vk.com/video-150963328_456239372
|