Анализ поведения по сигналам носимых устройств
Материал из MachineLearning.
Короткий адрес: http://bit.ly/2r3y70F
Содержание |
Проекты
Задача
- Название: Порождение признаков с помощью локально-аппроксимирующих моделей
- Задача: Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
- Данные:
- WISDM (Kwapisz, J.R., G.M. Weiss, and S.A. Moore. 2011. Activity recognition using cell phone accelerometers. ACM SigKDD Explorations Newsletter. 12(2):74–82.), USC-HAD или сложнее. Данные акселерометра (Human activity recognition using smart phone embedded sensors: A Linear Dynamical Systems method, W Wang, H Liu, L Yu, F Sun - Neural Networks (IJCNN), 2014)
- (Временной ряд (библиотека примеров), раздел Accelerometry).
- Литература:
- Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471-1483.[1]
- Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.URL
- Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. URL
- Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. URL
- Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. URL
- Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. URL
- Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. URL
- Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [2]
- Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [3]
- Базовый алгоритм: Описан в работе Кузнецова, Ивкина.
- Решение: Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
- Новизна: Создан стандарт построения локально-аппроксимирующих моделей.
- Авторы: С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов
Данные, ссылки на коллекции
- Smartphone Dataset for Human Activity Recognition, created 08/2017/
- This dataset contains data from 30 users within the age group of 22-79 years.
- A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
- This dataset contains data from 60 users.
- Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
- high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
- Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
- “PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”
- WISDM
Библиографические коллекции
- http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf
- Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.
- Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами
- По понятным причинам не очень хорошо работает для квазипериодических рядов
- http://www.jstor.org/stable/3212772
- Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.
- Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)
как правило, осуществляется с помощью FFT
- http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short
- B.G. Quinn, J.M. Fernandes, A fast efficient technique for the estimation of frequency, Biometrika 78 (1991) 489–498
- Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели
- Ряд приближается моделью ARMA(2,2), частота оценивается итеративно
- http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf
- Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization
- Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.
- http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf
- Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for
- accurate estimation of f0 and periodicity
- Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот (непонятная часть)
- http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1
- Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications
- переписывает множество оценок частоты непрерывного сигнала в дискретном случае
- On multiple pattern extraction using singular value decomposition
- Partha Pratim Kanjilal, Sarbani Palit
- IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.
- Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999
- P. P. Kanjilal, J. Bhattacharya and G. Saha
- Про устойчивость сингулярного разложения: SVD is the most robust null-space detector
- of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]
- http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf
- Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты
- https://doi.org/10.1109/TNNLS.2016.2531089
- https://doi.org/10.1007/s10444-016-9483-y
- https://doi.org/10.1007/s00521-015-2039-0
- https://doi.org/10.1016/j.neucom.2018.02.074
- https://academic.oup.com/biostatistics/advance-article/doi/10.1093/biostatistics/kxx070/4788724
- https://doi.org/10.1016/j.ins.2018.02.041
- https://doi.org/10.1016/j.asoc.2017.11.037
- https://doi.org/10.1016/j.asoc.2018.01.002
- http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
- Aligned Cluster Analysis for Temporal Segmentation of Human Motion
- Feng Zhou, Fernando De la Torre
- Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
- Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
- Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
- http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
- Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
- Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
- https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
- Temporal Segmentation of Facial Behavior
- Fernando De la Torre
- Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).
- Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
- Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
- Статья написана достаточно мутно
- http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
- Segmenting Motion Capture Data into Distinct Behaviors
- Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
- Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения
- Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения
- Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки
- http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
- O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
- Тоже PCA, для разрезов берутся
- 1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
- 2) минимумы угловой скорости, видимо, из тех же соображений
- http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
- further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
- http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
- P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
- Developed a string-based motif-finding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
- 1) уменьшают размерность с помощью PCA
- 2) каждому отсчету времени - по букве с помощью k-means кластеризации
- 3) повторения одной и той же буквы сокращаются до одного
- 4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними
- Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?
- 5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
- https://doi.org/10.1007/s11063-017-9592-8
- https://web.stanford.edu/~hallac/GGS.pdf
- http://eprints.lse.ac.uk/64863/8/Fryzlewicz_Multiple%20change-point%20detection_2017_published%20LSERO.pdf
- https://doi.org/10.1177/0278364917713116
- https://doi.org/10.1109/JSEN.2017.2703859
- https://doi.org/10.1117/12.2262918
- https://doi.org/10.1145/3014812.3014875
- https://doi.org/10.1145/3056540.3076194
- https://doi.org/10.1016/j.procs.2016.05.345
- https://doi.org/10.1177/1550147716683687
- https://doi.org/10.1109/35021BIGCOMP.2015.7072841
- https://dl.acm.org/citation.cfm?id=2997017
- https://doi.org/10.1016/j.ins.2017.11.045
- http://www.mdpi.com/1424-8220/18/4/1126/htm
- http://www.mdpi.com/1424-8220/18/2/623/htm
- https://doi.org/10.1007/s11042-015-3188-y
- https://doi.org/10.1142/S021951941850015X
- Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
- Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
- Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
- Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
- Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
- Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
- Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
- Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
- Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article