Открываем шестой цикл нашего проекта. Он будет посвящен урокам настоящей обработки данных, а партнером цикла выступит компания Яндекс. В феврале вы ближе познакомитесь с профессией аналитика данных, с помощью алгоритмов и моделей Machine Learning научитесь автоматизировать процесс анализа текстов на все основные типовые и орфографические ошибки и попробуете реализовать свой метод поиска ошибок.
Загляните в курс https://edu.sirius.online/#/course/578: материалы цикла уже размещены.
На онлайн-лекции «Методы нормализации неструктурированных данных. Уточнение данных на практике», которая состоится 4 февраля в 16:00 по мск, Алексей Толстиков, старший преподаватель факультета прикладной математики и информатики Белорусского государственного университета, тренер студентов и школьников на олимпиадах по программированию, куратор Школы анализа данных в компании Яндекс (г. Минск) подробно расскажет о:
методах нахождение ошибок/опечаток в тексте;
сопоставлении данных (когда мы слышим «МГУ» и «МГУ им. Ломоносова», понимаем, что это один и тот же университет);
выявлении заведомо ложных данных в тексте.
Ссылка на онлайн-трансляцию: https://youtu.be/4xmmdvhhOnM.
Перед лекцией давайте поближе познакомимся с экспертом текущего цикла: в интервью на сайте «Сириуса» Алексей Толстиков рассказал о предстоящем кейсе и сфере аналитики данных в целом: https://sochisirius.ru/news/5034.
 |