Участник:Mapishev
Материал из MachineLearning.
м (→Публикации) |
м (→Публикации) |
||
Строка 152: | Строка 152: | ||
==Публикации== | ==Публикации== | ||
- | # [https://habr.com/ru/companies/just_ai/articles/733110/ Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca] (авторская статья на habr.com) | + | # [https://habr.com/ru/companies/just_ai/articles/733110/ Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca] (авторская статья на habr.com, 2023) |
- | # [https://habr.com/ru/companies/just_ai/articles/720932/ Как мы улучшали выделение интентов в наших продуктах] (авторская статья на habr.com) | + | # [https://habr.com/ru/companies/just_ai/articles/720932/ Как мы улучшали выделение интентов в наших продуктах] (авторская статья на habr.com, 2023) |
# M. Apishev. [https://rdcu.be/cCAsb Effective Implementations of Topic Modeling Algorithms] // Programming and Computer Software, Vol. 47, No. 7, pp. 483–492, 2021. | # M. Apishev. [https://rdcu.be/cCAsb Effective Implementations of Topic Modeling Algorithms] // Programming and Computer Software, Vol. 47, No. 7, pp. 483–492, 2021. | ||
# E. Artemova, M. Apishev, V. Sarkisyan, S. Aksenov, D. Kirjanov, O. Serikov. [https://arxiv.org/abs/2104.12846 Teaching a Massive Open Online Course on Natural Language Processing] // Proceedings of the Fifth Workshop on Teaching NLP @ NAACL, 2021, pp. 13-27. | # E. Artemova, M. Apishev, V. Sarkisyan, S. Aksenov, D. Kirjanov, O. Serikov. [https://arxiv.org/abs/2104.12846 Teaching a Massive Open Online Course on Natural Language Processing] // Proceedings of the Fifth Workshop on Teaching NLP @ NAACL, 2021, pp. 13-27. |
Версия 13:50, 4 мая 2023
Мурат Апишев
К.т.н., выпускник кафедры Математических методов прогнозирования ВМК МГУ.
Научный руководитель: Воронцов Константин Вячеславович
Научные идентификаторы: 57022229800 (SCOPUS ID), R-9415-2016 (WoS ResearcherID)
My CV in English (upd. 10.2022)
Содержание |
Коммерческая деятельность
- Руководитель направления R&D в сфере NLU/NLP компании Just AI (с 2021)
- Специалист по анализу данных и разработчик в компании TalkMart42, сооснователь (2020 - 2022)
- Ведущий специалист по анализу данных в Альфа-Банке (2021)
- Старший специалист по анализу данных и руководитель NLP-команды в компании Digital Decisions (бывш. Aithea) (2019 - 2020)
- ML-инженер в группе качества рекомендаций в Яндекс Дзен (2017 - 2019)
- Младший разработчик в группе алгоритмов антиспама в Яндекс.Поиск (2016 - 2017)
- Инженер-программист в ФИЦ ИУ РАН (бывш. ВЦ РАН) (2014 - 2016)
Один из создателей open-source библиотеки для тематического моделирования bigartm
Педагогическая деятельность
Учебные курсы
- Преподаватель на кафедре ИС ФУПМ МФТИ [семестровый курс "Практикум по программированию на языке Python"] (c 2019)
- Преподаватель на кафедре ИС ФУПМ МФТИ [семестровый курс "Математические методы анализа текстов"] (c 2018)
- Преподаватель на кафедре ММП факультета ВМК МГУ [семестровый курс "Математические методы анализа текстов"] (c 2017)
- Лектор на курсах "Машинное обучение", "Рекомендательные системы" и "Глубинное обучение" онлайн-школы Нетология (с 2022)
- Соавтор и лектор семестрового онлайн-курса от ФКН НИУ ВШЭ "Анализ текстовых данных" (2020)
- Семинарист в Школе Анализа Данных компании Яндекс [годовой курс "Машинное обучение"] (2016 - 2019)
- Семинарист на ФКН НИУ ВШЭ [семестровый курс "Анализ неструктурированных данных"] (2017 - 2018)
Разовые учебные мероприятия
Дата(-ы) | Мероприятие | Место и обстоятельства проведения | Материалы |
---|---|---|---|
22.02.2023 | Онлайн-митап по обсуждению вопросов о профессии DS | Онлайн-школа Нетология | |
09.02.2022 | Вебинар по теме "Требования к NLP-специалистам в индустрии" на курсе повышения квалификации для преподавателей ВУЗов | ФКН ВШЭ и Альянс в сфере искусственного интеллекта | |
16.04.2021 | Интервью и рассказ о решении индустриальных задач NLP (съемка) | Онлайн-школа SkillFactory | |
Многократно с 2015 по 2022 | Лекция по теме "Параллельные, распределённые и онлайновые алгоритмы обучения тематических моделей" | курс "Машинное обучение на больших данных", ШАД; курс "Машинное обучение и большие данные", ФИВТ МФТИ | Слайды |
14-17.11.2018 | Мини-курс из четырёх лекций по машинному обучению в школе для одарённых детей "Сириус" (темы: "Введение в ML", "Метрические и линейные модели", "Решающие деревья и их композиции", "Искусственные нейронные сети") | Школа "Сириус" | Слайды первой лекции, слайды третьей лекции |
25.09.2017 | Лекция и семинар по теме "Тематическое моделирование: теория, инструменты, приложения" | Школа лингвистики ВШЭ | |
01.06.2017 | Лекция по теме "BigARTM: описание, API, юзкейсы" | Факультатив программы "Специалист по большим данным" NewProLab | |
17.03.2017 | Лекция по теме "Стратегии моделирования и регуляризации в BigARTM" | с/к "Вероятностное тематическое моделирование", ВМК МГУ | слайды |
17.03.2017 | Мастер-класс по тематическому моделированию (лекция с кейсами) | ФКН ВШЭ | Слайды, видео |
30.11.2015 | Семинар для членов научной группы К.В. Воронцова по теме "Методология проведения экспериментов с тематическими моделями с использованием библиотеки BigARTM" | ВМК МГУ | Слайды |
16.10.2015 | Семинар для членов научной группы К.В. Воронцова по теме "Использование библиотеки BigARTM из Python" | ВМК МГУ | Слайды |
25.09.2015 | Лекция по теме "Вероятностные тематические модели" | ФУПМ МФТИ | Конспект |
Публичные выступления
Дата | Событие | Тема | Материалы |
---|---|---|---|
07.03.2023 | Выступление на конференции OpenTalks.AI от компании Just AI | On the way to industrial NLP-platform: transformers, microservices, architecture | Статья на habr по части материалов |
02.12.2022 | Выступление на конференции Conversations от компании Just AI | Создание индустриальной NLP-платформы: трансформеры, микросервисы, архитектура | Статья на habr по части материалов |
31.03.2021 | Участие в подкасте hottcast от компании TalkMart42 | Биллборд в Новой Зеландии и вопросы о будущем к нейросети на safertomorrow.online | |
29.04.2020 | Онлайн-выступление на конференции DataStart от компании Digital Decisions (совместно с Роксаной Бушковой, Instinct, BBDO) | Анализ пользовательского контента в задаче поиска актуальных трендов для ситуативного маркетинга | |
29.04.2020 | Онлайн-выступление на конференции DataStart от компании Digital Decisions (совместно с Ириной Пионтковской, Huawei) | Готовим промышленную модель для голосового ассистента с минимальными затратами | |
23.04.2020 | Онлайн-выступление на конференции FRUCT | Learning Topic Models with Arbitrary Loss | Слайды |
20.02.2020 | Выступление на конференции OpenTalks.AI от компании Digital Decisions (совместно с Ириной Пионтковской, Huawei) | Готовим промышленную модель для голосового ассистента с минимальными затратами | |
30.11.2019 | Выступление на хакатоне DATA CULTURE HACK | Извлечение обсуждаемых тематик из корпуса текстов | Слайды |
14.04.2016 | Доклад в секции "Вычислительная математика и кибернетика" в подсекции "Машинное обучение" на студенческой конференции Ломоносов-2016 | Аддитивная регуляризация тематических моделей в задаче анализа этносоциального дискурса | Слайды |
08.04.2016 | Доклад на международной конференции AIST (г. Екатеринбург) | Parallel Non-blocking Deterministic Algorithm for Online Topic Modeling | Слайды |
21.10.2015 | Доклад на Всероссийском Инженерном Конкурсе | Программное обеспечение с открытым кодом для тематического моделирования больших текстовых коллекций | Слайды |
16.04.2015 | Доклад в секции "Вычислительная математика и кибернетика" в подсекции "Программирование" на студенческой конференции Ломоносов-2015 | Реализация мультимодальных регуляризованных тематических моделей в библиотеке с открытым кодом BigARTM | Слайды |
30.09.2014 | Выступление на научном семинаре в ШАД Яндекса в составе группы тематического моделирования К.В. Воронцова | Библиотека BigARTM | Слайды |
Конкурсы и награды
- Участник команды TalkMart42 (совместно с Романом Ищенко и Сергеем Черновым) - призере (3-е место) онлайн-хакатона по разработке "городских" навыков Алисы компании Яндекс. [2021]
- NLP-специалист в команде Buckwheat42 (совместно с Романом Ищенко и Сергеем Черновым) - победителе трека "Мегаполис-Москва" хакатона VirusHack [2020].
- Финалист научной премии имени Ильи Сегаловича компании Яндекс [2019].
- Награды за лучшую публикацию (соавтор) и лучший доклад в секции NLP на международной конференции AIST [2016].
- Победитель конкурса индивидуальных исследовательских проектов в рамках Всероссийского Инженерного Конкурса в секции "Информатика и вычислительная техника" [2015].
- Финалист Всероссийской Телевизионной Гуманитарной Олимпиады "Умники и Умницы" [2011].
- Абсолютный победитель Республиканского Конкурса Интернет-ресурсов в г. Майкоп [2010].
Образование
- В 2020 защитил диссертацию на соискание ученой степени кандидата технических наук по теме "Эффективная реализация алгоритмов тематического моделирования с аддитивной регуляризацией" (г. Москва)
- В 2020 досрочно закончил аспирантуру факультета ВМК МГУ на кафедре математических методов прогнозирования (г. Москва)
- В 2017 с отличием закончил магистратуру факультета ВМК МГУ на кафедре математических методов прогнозирования (г. Москва)
- В 2015 закончил бакалавриат факультета ВМК МГУ на кафедре математических методов прогнозирования (г. Москва)
- В 2011 с отличием и серебрянной медалью закончил 11 физико-математический класс гимназии №22 (г. Майкоп)
- В 2011 с отличием закончил РЕМШ при АГУ по направлению "Физика" (г. Майкоп)
- В 2010 с отличием закончил школу программирования УЦКО "Турбо" по направлению "Системное программирование" (г. Майкоп)
Публикации
- Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca (авторская статья на habr.com, 2023)
- Как мы улучшали выделение интентов в наших продуктах (авторская статья на habr.com, 2023)
- M. Apishev. Effective Implementations of Topic Modeling Algorithms // Programming and Computer Software, Vol. 47, No. 7, pp. 483–492, 2021.
- E. Artemova, M. Apishev, V. Sarkisyan, S. Aksenov, D. Kirjanov, O. Serikov. Teaching a Massive Open Online Course on Natural Language Processing // Proceedings of the Fifth Workshop on Teaching NLP @ NAACL, 2021, pp. 13-27.
- M. Apishev, K. Vorontsov, Learning Topic Models With Arbitrary Loss // Proceedings of the 26th Conference of FRUCT Association, 2020, pp. 30-37.
- Апишев М. А. Эффективные реализации алгоритмов тематического моделирования // Труды ИСП РАН, том 32, вып. 1, 2020 г., стр. 137–152.
- Жариков И. Н., Апишев М. А., Воронцов К. В. Гиперграфовые многомодальные вероятностные тематические модели транзакционных данных // Интеллектуализация обработки информации (ИОИ-2018): Тезисы докл. — Москва: Торус Пресс, 2018. С.148–149.
- Denis Kochedykov, Murat Apishev, Lev Golitsyn, Konstantin Vorontsov. Fast and Modular Regularized Topic Modelling // Proceedings of the 21st conference of FRUCT association, 2017, pp. 182-193.
- Апишев М. А., Кольцов С. Н., Кольцова О. Ю., Николенко С. И., Воронцов К. В. Аддитивная регуляризация тематических моделей для поиска этничного дискурса в социальных медиа // Интеллектуализация обработки информации (ИОИ-2016): Тезисы докл. — Москва: Торус Пресс, 2016. С.170–171.
- Apishev M., Koltcov S., Koltsova O., Nikolenko S., Vorontsov K. Additive Regularization for Topic Modeling in Sociological Studies of User-Generated Texts // Advances in Computational Intelligence, 15th Mexican International Conference on Artificial Intelligence, MICAI 2016, Cancún, Quintana Roo, Mexico, October 23 to 29, 2016. Proceedings, Part I. Lecture Notes in Artificial Intelligence, Volume 10061, pp. 166–181.
- Apishev M., Koltcov S., Koltsova O., Nikolenko S., Vorontsov K. Mining Ethnic Content Online with Additively Regularized Topic Models // Computación y Sistemas, Vol. 20, No. 3, 2016, pp. 387–403.
- Апишев М. А. Аддитивная регуляризация тематических моделей в задаче анализа этносоциального дискурса // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2016», секция «Вычислительная математика и кибернетика» - Москва: МАКС Пресс, 2016, с. 117–119.
- Oleksandr Frei and Murat Apishev. Parallel Non-blocking Deterministic Algorithm for Online Topic Modeling // Analysis of Images, Social Networks and Texts. AIST 2016. Communications in Computer and Information Science, vol 661. Springer, pp. 132–144.
- K. Vorontsov, O. Frei, M. Apishev., P. Romov, M. Suvorova, A. Yanina. Non-Bayesian Additive Regularization for Multimodal Topic Modeling of Large Collections // Topic Models: Post-Processing and Applications, CIKM 2015 Workshop, October 19, 2015, Melbourne, Australia. ACM, New York, NY, USA. pp. 29–37.
- Воронцов К. В., Фрей А. И., Ромов П. А., Янина А. О., Суворова М. А., Апишев М. А. BigARTM: библиотека с открытым кодом для тематического моделирования больших текстовых коллекций // Аналитика и управление данными в областях с интенсивным использованием данных. XVII Международная конференция DAMDID/RCDL’2015, Обнинск, 13-16 октября 2015. — С.28–36.
- Апишев М. А. Реализация мультимодальных регуляризованных тематических моделей в библиотеке с открытым кодом BigARTM // Сборник тезисов XXII Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2015», секция «Вычислительная математика и кибернетика» - Москва: МАКС Пресс, 2015, с. 91–92.
- Vorontsov K. V., Frei O. I., Apishev M. A., Romov P. A., Dudarenko M. A. BigARTM: Open Source Library for Regularized Multimodal Topic Modeling of Large Collections // AIST’2015, Analysis of Images, Social networks and Texts. Springer International Publishing Switzerland, 2015. Communications in Computer and Information Science (CCIS), pp. 370–384.
- Воронцов К. В., Фрей А. И., Апишев М. А., Дойков Н. В., Суворова М. А. Регуляризация тематических моделей в библиотеке с открытым кодом BigARTM // Математические методы распознавания образов: 17-ая Всеросс. конф.: Докл. М.: Торус, 2015. С. 222–223.
- Воронцов К. В., Потапенко А. А., Фрей А. И., Апишев М. А., Дойков Н. В., Шапулин А. В., Чиркова Н. А. Многокритериальные и многомодальные вероятностные тематические модели коллекций текстовых документов // Интеллектуализация обработки информации (ИОИ-2014): Тезисы докл. — Москва: Торус Пресс, 2014. С. 198–199.