Вероника

Сообщения

Сообщения за май, 2025

мая 11, 2025

Практическое задание №2. Структурный Sentiment анализ информации с моделями MDS, ACM и оценкой дисперсии. 1. Положительный текст о животных: 2. Текст с негативной окраской о взломах. Выводы: Анализ текстов показал разницу в эмоциональном окрасе. Большей эмоциональной выразительностью оказался текст с негативным посылом. Текст с позитивным посылом насыщен хорошей информацией, однако обладает меньшим уровнем эмоциональности, в отличие от другого. Модель анализа смыслового содержания, а именно acm дала более точную идентификацию типа эмоций, модель feature statistics точнее определила степень выраженности эмоций.

Далее...

мая 11, 2025

Практическое задание №3. Sentiment Analysis в социальных медиа. 1. Gucci Соотношение позитивных и негативных упоминаний равно 4:1. Позитивные и нейтральные упоминания преобладают. Видеоконтент явно преобладает (38%), после него- фото (35%) Анализ ключевых слов выявил, что пользователей более всего интересуют определенные позиции бренда. 2. Versace Cоотношение позитивных и негативных упоминаний 9:1. Позитив преобладает. Лидирующую позицию занимает фотоконтент (38%) , затем видеоконтент (35%) Ключевые слова дали понять, что пользователей интересуют модные показы и дружба с Элтоном Джоном 3. Balenciaga Соотношение позитива и негатива: 3:2. Позитивные связаны с похвалой бренда, негативные- с коллекциями модного дома. Первое место- видеоконтент ( 36%), второе- фотоконтент (34%) Лидирующие ключевые слова по запросам: конкретная продукция бренда. Все бренды, которые я проанализировала имеют более положительные отзывы, чем отрицательные. Массово преобладает фото и...

Далее...

мая 11, 2025

Практическое задание №9 Регрессионный анализ с линейной проекцией и моделью svm Для данной работы я выбрала статистику разводов в России и Соединенных Штатах на 1000 человек. Вывод: анализ взаимосвязи двух групп данных нам показывает, что взаимосвязь между ними есть, но она невероятно мала. Тематика взятых мной данных не предполагает взаимосвязи между ними. На мой взгляд, самой удобными моделями оказались Scatter Plot и Linear Projection. Polynomial Regression мне понравилась меньше всего, так как менее отчетливо видно, что данные, которые я использовала практически не пересекаются и не связаны между собой.

Далее...

мая 11, 2025

Практическое задание №8. NETWORK- анализ. Я выбрала файл с альбомами (lastfm.net) 1. В модели Network Explorer преобладает зеленый цвет (rock). Доминирующий тип контента-другие. 2. Rock- центральный элемент связей. 3. Для моего восприятия более комфортная для анализа модель Network Explorer, потому что там можно увидеть преобладающий тип контента. В модели MDS сложнее ориентироваться и понимать взаимосвязь. В Correlations слишком много информации, модель сложная.

Далее...

мая 11, 2025

Практическое задание №7 Графический анализ с кластеризацией и алгоритмом T-SNE Hierarchical Clustering t-SNE Image Grid На мой взгляд, результаты кластеризации оказались наиболее точными, так как фотографии в этой модели были сгруппированы не только по цветовой палитре, но и по наличию фигур и изображенным объектам. В то время как две другие модели делили фотографии на группы исключительно по наличию оттенков. Для анализа я брала простые фотографии зданий- 10 фото достопримечательностей разных стран. Фото разделились на группы по наличию схожих оттенков в моделях T-SNE и Image Grid. Единственная модель, которая учла не только оттенки, но и объекты и наличие фигур, изображенных на фото - это Hierarchical Clustering. В целом, я согласна с результатом кластеризации, так как в ней явно прослеживаются отличие картинок друг от друга. Менее согласна с логикой разделения в двух других моделях, они не учитывают эти особенности.

Далее...

мая 11, 2025

Практическое задание №6. Графический анализ. Результаты моделей MDS И Image Grid не имеют значительных отличий. По моим предположениям, обе модели группировали по наличию оттенков и по наличию фигур. Image Grid показалась мне более удобной, так как дает возможность оценить схожесть картинок визуально. Для анализа я выбрала фото 10 достопримечательностей разных стран. Фото распределились на небольшие группы примерно по схожести форм зданий. Я согласна с такой логикой рвзделения.

Далее...

мая 11, 2025

Практическое задание №5 Автоматизированный кластерный анализ. Для анализа были взяты 10 текстов на тему ЗОЖ В процессе анализа мои тексты распределились на 5 групп. Основная масса текстов попала в группу с3, темы, в которых речь идет преимущественно про организм и его состояние. Еще 2 группы, схожие по величине с2 и с5, в первой из них речь идет о вредных и полезных привычках, во второй- о здоровом питании и пользе воды. Тема о вреде сахара отделилась от группы про питание, тк в ней идет речь о вреде. Так же от общей массы отделилась и тема про медитации, интересно то, что она не объединилась с темой о психическим здоровьем. По моим предположениям, по эмоциональной окраске тексты примерно все одинаковы, так как были взяты с одного сайта, структура у них тоже примерно одинаковая. По группам они разделились из-за схожих ключевых слов. При изменении уровня кластеризации, число групп менялось. При перемещении разделителя в левую сторону, групп становилось меньше, а при перемещен...

Далее...

мая 10, 2025

Практическое задание №4. Автоматизированный контент-анализ с моделью текста Для анализа были взяты 2 коротких рассказа Чехова: "Толстый и тонкий" и "Злой мальчик" 1. "Толстый и тонкий": 2. "злой мальчик": Вывод: На мой взгляд, модель текста хорошо отражает содержание. Мне понравилась схема в word cloud: если использовать длинные тексты по теме, она эффективно выделяет ключевые слова и основные идеи. Это действительно полезный инструмент, и, на мой взгляд, такая методика проще в применении.

Далее...