Практическое задание №5 Автоматизированный кластерный анализ.
Для анализа были взяты 10 текстов на тему ЗОЖ
В процессе анализа мои тексты распределились на 5 групп. Основная масса текстов попала в группу с3, темы, в которых речь идет преимущественно про организм и его состояние. Еще 2 группы, схожие по величине с2 и с5, в первой из них речь идет о вредных и полезных привычках, во второй- о здоровом питании и пользе воды. Тема о вреде сахара отделилась от группы про питание, тк в ней идет речь о вреде. Так же от общей массы отделилась и тема про медитации, интересно то, что она не объединилась с темой о психическим здоровьем.
По моим предположениям, по эмоциональной окраске тексты примерно все одинаковы, так как были взяты с одного сайта, структура у них тоже примерно одинаковая. По группам они разделились из-за схожих ключевых слов.
При изменении уровня кластеризации, число групп менялось. При перемещении разделителя в левую сторону, групп становилось меньше, а при перемещении в правую сторону- больше. (минимум 2 группы, максимум 10).
Комментарии
Отправить комментарий