Методы анализа текстов (семинар, К.В.Воронцов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Расписание (осень 2018))
Текущая версия (07:11, 11 декабря 2018) (править) (отменить)
м (Расписание (осень 2018))
 
(42 промежуточные версии не показаны)
Строка 1: Строка 1:
-
Cеминары по анализу текстов, открытые для всех желающих. Цель — быть в курсе современных подходов в области обработки текста на естественном языке (Natural Language Processing, NLP). На каждом семинаре у нас будет доклад и свободное обсуждение. Особенно часто будем обсуждать тематическое моделирование и глубокие нейронные сети.
+
Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.
== Где и когда ==
== Где и когда ==
-
Спецсеминар проводится по средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории '''Гарвард'''.
+
По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова ([https://drive.google.com/open?id=0B2cCJQ2_aOwjbWljemlzMjZDckk вот сюда]) с паспортом.
-
Проход строго по спискам! Записаться на осенний семестр 2018 года [https://docs.google.com/spreadsheets/d/11dA2u6IaNfT4D5cAa_TkiK__-rsZtoaVS7Z8TFFCSyY/edit?usp=sharing нужно здесь].
+
Проход строго по спискам. Записаться на осенний семестр 2018 года [https://docs.google.com/spreadsheets/d/11dA2u6IaNfT4D5cAa_TkiK__-rsZtoaVS7Z8TFFCSyY/edit?usp=sharing нужно здесь].
 +
Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.
-
Приходить на проходную с обратной стороны Мамонтова ([https://drive.google.com/open?id=0B2cCJQ2_aOwjbWljemlzMjZDckk вот сюда]) с паспортом.
+
== Контакты и ссылки ==
-
== Контакты ==
+
Канал в телеграме: '''NLP_weekly'''
-
anna.a.potapenko at gmail.com (Анна Потапенко) — почта организатора семинара, пишите с любыми вопросами.
+
-
artm_dev at googlegroups.com — рассылка для студентов и аспирантов К.В. Воронцова, а также всех, кто как-то связан с проектом bigartm.org. Когда посылаете запрос на добавление, в "причине" напишите пару слов о себе.
+
По всем вопросам: anna.a.potapenko at gmail.com
https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.
https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.
-
https://goo.gl/rc4grq — короткая ссылка на страницу прошлого года.
+
https://goo.gl/rc4grq — короткая ссылка на [[Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год|страницу 2017-2018 учебного года]].
== Расписание (осень 2018) ==
== Расписание (осень 2018) ==
Строка 31: Строка 31:
[https://arxiv.org/abs/1801.06146 Universal Language Model Fine-tuning for Text Classification]
[https://arxiv.org/abs/1801.06146 Universal Language Model Fine-tuning for Text Classification]
| Михаил Архипов (IPavlov)
| Михаил Архипов (IPavlov)
-
|
+
| [https://drive.google.com/open?id=1-3rHHUQgIHZZSu5dvGYhjX1d36I5TVYo Презентация]
|- <!-- Конец записи -->
|- <!-- Конец записи -->
|- <!-- Новая запись -->
|- <!-- Новая запись -->
|-
|-
| 19 сентября
| 19 сентября
-
| Разбор статей: [https://arxiv.org/pdf/1807.03367.pdf Talk the Walk: Navigating New York City through Grounded Dialogue] (FAIR, 2018)
+
| 1. Order-embeddings and [http://hyperbolicdeeplearning.com/?p=38 hyperbolic deep learning]
-
[https://ronan.collobert.com/pub/matos/2008_nlp_icml.pdf A Unified Architecture for Natural Language Processing] (Collobert & Weston, 2008)
+
2. Multitask learning in NLP: from 2008 to 2018
-
| Татьяна Савельева (Яндекс)
+
| 1. Роман Дербаносов
-
|
+
2. Татьяна Савельева (Яндекс)
 +
| 1. Hyperbolic embeddings. [https://drive.google.com/open?id=1gDy0HXe-m70OrpgxoOSUDeliucTb8BiI Презентация] Статьи: [https://arxiv.org/pdf/1511.06361.pdf 1] [https://arxiv.org/pdf/1705.08039.pdf 2] [https://arxiv.org/pdf/1804.01882.pdf 3] [https://arxiv.org/pdf/1805.09112.pdf 4]
 +
2. Multitask learning. [https://drive.google.com/open?id=1vfOWC_pYngLnoc-y124vyNmFdCTAPo6e Презентация] Статьи: [https://ronan.collobert.com/pub/matos/2008_nlp_icml.pdf 1] [https://arxiv.org/pdf/1808.07658.pdf 2]
|- <!-- Конец записи -->
|- <!-- Конец записи -->
|- <!-- Новая запись -->
|- <!-- Новая запись -->
|-
|-
| 26 сентября
| 26 сентября
-
| Доклад по теме диссертации. Методы NLP, устойчивые к шуму.
+
| Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка."
| Валентин Малых (МФТИ)
| Валентин Малых (МФТИ)
 +
| [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM Презентация]
 +
[https://drive.google.com/open?id=1Jt6EvPtDU__7_6uaIWELzaonF0weD9rW Черновик автореферата]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 3 октября
 +
| Извлечение семантических фреймов и смыслов слов с использованием векторных представлений
 +
| Александр Панченко (Университет Гамбурга)
 +
| Публикации в основе доклада:
 +
1. [http://aclweb.org/anthology/P17-1145 ACL-2017 paper],
 +
2. [http://aclweb.org/anthology/P18-2010 ACL-2018 paper],
 +
3. [http://aclanthology.coli.uni-saarland.de/papers/W16-1620/w16-1620 Rep4NLP workshop 2016 (best paper)]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 10 октября
 +
| Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д.
 +
| Николай Скачков (ВМК МГУ)
 +
| [https://drive.google.com/file/d/1XP3GERV03unzE5JWm7pHdEHR3vFbXGjf/view?usp=sharing Презентация]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 17 октября
 +
| Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты.
 +
| Антон Бахтин (Facebook Research)
 +
| [https://yadi.sk/i/61IONRiwOHeDhw Презентация]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 24 октября
 +
| Эрмитовы векторные представления слов.
 +
| Алексей Зобнин (Яндекс)
 +
|
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 31 октября
 +
| Variational autoencoder. Гибридные модели VAE+LDA.
 +
| Коля Шаталов, Настя Фадеева.
 +
| [https://drive.google.com/open?id=1aeFiEO3yoLjSVlCRgsH4q9Kjrh32Ujcn Слайды VAE], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUD слайды VAE-LDA]
 +
Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUDhttps://arxiv.org/pdf/1706.00359.pdf 3]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 7 ноября
 +
| Goal-oriented dialogue systems.
 +
| Никита Юдин, Саша Волохова
 +
| [https://drive.google.com/open?id=1WlLQYuF6Ozv7DYIFIIXoiYXRuaBa3gVQ Презентация]
 +
Статьи: [http://proceedings.mlr.press/v80/yarats18a/yarats18a.pdf 1], [https://arxiv.org/abs/1802.03881 2].
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 14 ноября
 +
| Модели на основе трансформера: BERT и LISA.
 +
| Татьяна Савельева, Ксения Вальчук
 +
| Статьи: [https://arxiv.org/abs/1810.04805 BERT] , [https://arxiv.org/abs/1804.08199 LISA]
 +
Презентация: [https://drive.google.com/open?id=1gpvHuRO9RrQV1Nv-C392QxmVjpjlu8xM BERT], [https://drive.google.com/open?id=1MnD20aT-gHxPc8YmrBsmWpiW8nScYlpu LISA]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 21 ноября
 +
| Hyperbolic embeddings - с кодом и примерами.
 +
| Геннадий Штех
 +
|
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 28 ноября
 +
| Разборы статей EMNLP-2018
 +
| Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев
 +
| Статьи: [https://arxiv.org/abs/1804.07755 Unsupervised MT], [http://aclweb.org/anthology/D18-1002 Adversarial learning], [http://aclweb.org/anthology/W18-6017 Кросс-лингвистический парсинг].
 +
Презентации: [https://drive.google.com/open?id=1euQk0-moNb8oLc1_r-1TDSrimZqN6dSt 1], [https://drive.google.com/open?id=146iLX0f1kJDNvi7XSaZ6xhfsBDD0P3To 2], [https://drive.google.com/open?id=18ALcpsql-iMGQwOR0qs2pPf7dMYxXGYD 3]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 5 декабря
 +
| Язык и мозг: как все устроено
 +
| Анастасия Лопухина (Центр языка и мозга, ВШЭ)
 +
| [https://drive.google.com/open?id=1q3mzutRGAZ8b_4ESCMiP6x8uDhqTawGM Презентация]
 +
|- <!-- Конец записи -->
 +
|- <!-- Новая запись -->
 +
|-
 +
| 12 декабря
 +
| Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте.
 +
| Николай Кругликов, Павел Поляков.
|
|
|- <!-- Конец записи -->
|- <!-- Конец записи -->
|}
|}
 +
 +
== Подстраницы: семинары прошлых лет ==
 +
{{Служебная:Prefixindex/Методы анализа текстов (семинар, К.В.Воронцов)/}}
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Текущая версия

Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.

Содержание

Где и когда

По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова (вот сюда) с паспортом.

Проход строго по спискам. Записаться на осенний семестр 2018 года нужно здесь. Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.

Контакты и ссылки

Канал в телеграме: NLP_weekly

По всем вопросам: anna.a.potapenko at gmail.com

https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.

https://goo.gl/rc4grq — короткая ссылка на страницу 2017-2018 учебного года.

Расписание (осень 2018)

Дата Тема Докладчик Материалы
12 сентября Обзор статей ACL-2018. Разбор статьи

Universal Language Model Fine-tuning for Text Classification

Михаил Архипов (IPavlov) Презентация
19 сентября 1. Order-embeddings and hyperbolic deep learning

2. Multitask learning in NLP: from 2008 to 2018

1. Роман Дербаносов

2. Татьяна Савельева (Яндекс)

1. Hyperbolic embeddings. Презентация Статьи: 1 2 3 4

2. Multitask learning. Презентация Статьи: 1 2

26 сентября Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка." Валентин Малых (МФТИ) Презентация

Черновик автореферата

3 октября Извлечение семантических фреймов и смыслов слов с использованием векторных представлений Александр Панченко (Университет Гамбурга) Публикации в основе доклада:

1. ACL-2017 paper, 2. ACL-2018 paper, 3. Rep4NLP workshop 2016 (best paper)

10 октября Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д. Николай Скачков (ВМК МГУ) Презентация
17 октября Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты. Антон Бахтин (Facebook Research) Презентация
24 октября Эрмитовы векторные представления слов. Алексей Зобнин (Яндекс)
31 октября Variational autoencoder. Гибридные модели VAE+LDA. Коля Шаталов, Настя Фадеева. Слайды VAE, слайды VAE-LDA

Статьи: 1, 2, 3

7 ноября Goal-oriented dialogue systems. Никита Юдин, Саша Волохова Презентация

Статьи: 1, 2.

14 ноября Модели на основе трансформера: BERT и LISA. Татьяна Савельева, Ксения Вальчук Статьи: BERT , LISA

Презентация: BERT, LISA

21 ноября Hyperbolic embeddings - с кодом и примерами. Геннадий Штех
28 ноября Разборы статей EMNLP-2018 Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев Статьи: Unsupervised MT, Adversarial learning, Кросс-лингвистический парсинг.

Презентации: 1, 2, 3

5 декабря Язык и мозг: как все устроено Анастасия Лопухина (Центр языка и мозга, ВШЭ) Презентация
12 декабря Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте. Николай Кругликов, Павел Поляков.

Подстраницы: семинары прошлых лет

Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год