Общество

Светлана Толдова
кандидат филологических наук, старший научный сотрудник МГУ

«Главное – вычислить базовые интересы»

28 августа 2012, 13:46

Фото: ИТАР-ТАСС

В СМИ появилась неофициальная информация, что в начале этого года Служба внешней разведки (СВР) объявила три закрытых тендера на сумму свыше 30 млн рублей на разработку новых методик мониторинга блогосферы, а также способов «массового распространения информационных сообщений в заданных социальных сетях с целью формирования общественного мнения».

Допустим, у одного человека 100 друзей, у другого – 50, и они довольно сильно пересекаются. Логично предположить, что эти люди как-то близки

В компании «Итеранет», которая, по данным газеты «Коммерсант», была выбрана исполнителем, эти сообщения опровергли. «Разработкой систем мониторинга блогов и вброса информации в блогосферу мы не занимаемся... Таких контрактов, о которых пишет «Коммерсант», не было. Эти работы мы не выполняем», – заявил гендиректор фирмы Игорь Мацкевич РИА «Новости».

Между тем председатель Общественного совета при Минобороны России Игорь Коротченко сообщил в своем блоге, что внешняя разведка и контрразведка Эстонии проводят свой собственный анализ по изложенным в статье фактам, посчитав, что затрагиваются интересы национальной безопасности Эстонской Республики.

О том, как в принципе работают технологии, позволяющие контролировать социальные сети, газете ВЗГЛЯД рассказала доцент кафедры теоретической и прикладной лингвистики МГУ им. Ломоносова, доцент Института лингвистики РГГУ, кандидат филологических наук Светлана Толдова.

ВЗГЛЯД: Светлана Юрьевна, как, по каким признакам поисковым программам удается классифицировать пользователей блогов?

Светлана Толдова: Во-первых, по ключевым словам на социальных страницах – они находятся или в текстах, или в тегах, которые ставят сами люди. Во-вторых, по ссылкам. В-третьих, во многих блогах, к примеру в Twitter или Facebook*, у человека есть некоторый круг общения. По этим «френдам» вы можете автоматически вычислить некоторый социум. Допустим, у одного человека 100 друзей, у другого – 50, и они довольно сильно пересекаются. Логично предположить, что эти люди как-то близки. Возможно, их объединяет общность интересов, или они входят в социальную группу, сформированную по какому-то признаку: это может быть научный, социальный интерес или просто круг общения. Соответственно, по тому, кого люди указывают в друзьях, или по тому, кому они посылают приглашение к контакту, можно отследить некоторый круг общения.

Светлана Толдова полагает, что нити интересов позволяют связать пользователей во вполне определенные группы (Фото: darwin.philol.msu.ru)

Вы приходите на страницу того, кто не закрывает свой Facebook, и видите, кто у него в друзьях. Вы с кем-то делитесь новостью – это тоже входит в ваш круг общения. Вы кому-то «ретвитите» – конечно, можно всем подряд пересылать сообщение, но, скорее всего, вы пошлете его людям, которым это потенциально может быть интересно.

Кроме того, во многих социальных сетях предлагается заполнить какую-то анкету, где человек может указать свои интересы. Такие данные можно анализировать, как и любой другой контент, как любые статьи. Подобно тому, как новости группируют по сюжетам при помощи специальных математических процедур, можно поступить с темами и интересами, которые люди указывают. Можно объединить людей по близости интересов и потом посмотреть, например, какие фильмы они чаще всего упоминают в своих блогах или ставят им «лайк», на какие события обращают внимание.

ВЗГЛЯД: Насколько я понимаю, в интернете уже давно определяются интересы различных групп, для чего это делается?

С. Т.: В поисковых программах используются так называемые рекомендательные системы. Вы начинаете работать с каким-то ресурсом, скачивая оттуда фотографии, фильмы или музыку, а через некоторое время вам уже и без запроса начинают предлагать то, что вам, вероятнее всего, понравится.

Для начала такая система разбивает пользователей по группам – по тому, что они явно указали, или по неявным признакам, например по тематике, которой они чаще всего интересуются, а затем начинает предлагать то же, что и тем пользователям, которые входят в эту группу.

Допустим, вышел какой-то фильм, который интересен большому количеству пользователей из некоторой группы. Когда вы авторизовались, вас автоматически к ней отнесли, поскольку ваше поведение похоже на эту группу, – тогда вам начинают предлагать те же самые объекты.

Каждый, кто когда-нибудь скачивал фильмы, мог обратить внимание на то, что через какое-то время сама поисковая система начинает предлагать что-то похожее на уже выбранное вами, а иногда социальная сеть явно говорит: «Еще 10 пользователей выбрали этот фильм». Человек смотрит новости в Google, а через какое-то время ему предлагают, не хочет ли он создать тему, по которой ему будут поставляться новости.

ВЗГЛЯД: Наверняка это используется не только сайтами с медийным контентом?

С. Т.: Если это система мониторинга для коммерческих продаж, вам будут предлагать те же самые объекты для продажи. Если это система мониторинга социальных сетей интеллектуального контента, вам будут предлагать тот же самый интеллектуальный контент, которым заинтересовались пользователи из вашей группы. Технология одна и та же, главное – сформировать пользовательские группы по интересам и вычислить их базовые интересы.

ВЗГЛЯД: А есть какая-то специфика в работе системы, в задачи которой входит выяснить политические, религиозные и тому подобные предпочтения людей, количество таких людей и их активность?

С. Т.: Есть некоторые типовые задачи анализа контента, которые пытаются решать многие организации. К примеру, это кластеризация контента, то есть объединение похожих текстов в группы. Вспомните, в новостях «Яндекса» все статьи сгруппированы относительно некоторого события. То же самое можно делать с социальным контентом: группировать по разным признакам – уже перечисленным (выставленным тегам, пользователям, которым высылается контент), а кроме того, по ключевым словам, которые содержатся в записях, и по так называемым именованным сущностям, которые можно там выделить.

ВЗГЛЯД: Что это за сущности, и как их обнаружить?

С. Т.: Это отдельная задача – найти в тексте объекты, соответствующие именам собственным, которые можно там выделить. Как правило, всех интересуют люди, организации, места, даты и иногда события, которые имеют какие-то имена, а также продукты – продукты фирмы или продукты интеллектуальной деятельности – названия фильмов, книг и т. д. Система нацелена на то, чтобы извлекать все это из текстов. Потом по этим признакам тоже можно группировать контент и пользователей. Более того, можно мониторить интересы людей, что сейчас наиболее актуально для той или иной социальной группы.

Можно делать это и «вручную»: посадить группу людей и поставить им задачи определять что-то из кластеров, то есть близких по составу слов текстов.

ВЗГЛЯД: Вы постоянно говорите об «интересе», но ведь интерес к какому-то объекту не всегда означает, что субъект хорошо к нему относится...

С. Т.: Сейчас очень модным направлением в исследованиях как раз стала «тональность» – обнаружение экспрессии в тексте. Это широкое понятие. В социальных сетях обычно ставятся несколько задач, одна из них – понять, насколько агрессивны тексты для данной группы пользователей, для данной темы. Как правило, это индексируется по некоторым словам. Чем больше оценочных слов, тем очевиднее, что в тексте есть некоторая эмоциональность. Дальше остается определить, какие слова означают положительную или отрицательную эмоциональность в связи с некоторым событием. Как правило, определяются два параметра: отрицательная или положительная оценка, а также ее интенсивность.

* Организация (организации) ликвидированы или их деятельность запрещена в РФ

Текст: Роман Крецул

Вам может быть интересно

ВС России поразили военные аэродромы и объекты энергетики ВПК Украины
Темы дня

Парадоксальный белорусский эксперимент имеет значение и для России

Белоруссия подводит итоги парадоксального для текущих геополитических событий эксперимента. В то время, как западные соседи почти полностью закрыли границы с этой страной, Минск ввел безвизовый режим для граждан стран Евросоюза. Это не только принесло Белоруссии значительную финансовую выгоду, но и показало ее политические преимущества – а также пример, который мог бы быть интересен и для России.

Падение «индекса несломленности» ведет украинцев к переговорам с Россией

Украинские и западные социологи продолжают выяснять, готово ли общество к переговорам с Россией и территориальным уступкам. И они, как правило, выдают противоречивые результаты. В чем заключаются особенности этого противоречия и каковы реальные настроения украинцев относительно урегулирования конфликта?

Рогов: Освобождение Великой Новоселки ускорит наступление в Запорожской области

Пассажиры загоревшегося SSJ-100 в Анталье решили подать коллективный иск

Основатель ЧВК Blackwater оценил шансы Украины вернуть территории

Новости

Эксперт: Освобождение Великой Новоселки грозит ВСУ большим окружением

ВСУ пытаются держаться за Великую Новоселку по нескольким причинам. Потеря этого населенного пункта, во-первых, создаст угрозу для следующего узла обороны украинской армии. А во-вторых, группировка противника на Кураховском направлении может оказаться в большом окружении, сказал газете ВЗГЛЯД военный аналитик Михаил Онуфриенко. Ранее стало известно о продвижении ВС России к Великой Новоселке в ДНР.

Европа возобновила обсуждения отправки войск на Украину

Отправка европейских войск на Украину вновь обсуждается на фоне возможного отказа поддержки от США после прихода Дональда Трампа к власти в январе 2025 года, пишет Le Monde.

FT: На выборах в Румынии произошло политическое землетрясение

Выступающий за союз с Россией Кэлин Георгеску выиграл первый тур президентских выборов в Румынии, что вызвало «политическое землетрясение» в стране, пишет The Financial Times.

Кадыров рассказал о ставшем кошмаром для ВСУ бойце-украинце

Глава Чечни Рамзан Кадыров похвалил отряд спецназа «Ахмат» под руководством украинца по прозвищу Хохол за успешные операции на фронте против Вооруженных сил Украины (ВСУ).

Ростех сообщил о возможности создания боевых роботов

Госкорпорация «Ростех» заявила о способности превращать танки, БМП и БТР в дистанционно управляемые боевые роботы с помощью специальных комплексов.

Посол России заявил об устроенной ВСУ «кровавой бане» в Селидово

ВСУ начали расстреливать мирных жителей в Селидово за два дня до прихода российских войск, следственные органы РФ будут разбираться с доказательствами, сообщил посол по особым поручениям МИД по преступлениям киевского режима Родион Мирошник.

Заболеваемость ВИЧ в России достигла исторического минимума

Заболеваемость ВИЧ в России с 2016 года снизилась почти на 40%, достигнув исторического минимума, сообщил министр здравоохранения Михаил Мурашко.

Пушилин сообщил о прорыве обороны ВСУ в Курахово

Российские войска в Курахово в ДНР активно прорывают оборону украинских сил, и власти региона ожидают позитивных известий, сообщил глава республики Денис Пушилин.

ВКС получили новые истребители-бомбардировщики Су-34

Объединенная авиастроительная корпорация передала ВКС России партию новейших истребителей-бомбардировщиков Су-34, которые уже доказали эффективность в реальных боевых условиях.

Правнучку Хрущева призвали проверить на шпионаж

Движение «Зов народа» обратилось в Генпрокуратуру и Минюст с просьбой проверить правнучку первого секретаря ЦК КПСС Никиты Хрущева Нину Хрущеву на шпионаж.

Появились сообщения об ударе ракетами ATACMS по аэродрому в Курской области

Украинские военные якобы обстреляли ракетами ATACMS аэродром в Курской области, большую часть выпущенных ракет перехватили, сообщают Telegram-каналы.

Пленный британец заявил об отправке в Курскую область против воли

Британский наемник Джеймс Скотт Рис Андерсон, взятый в плен в Курской области, заявил, что командование ВСУ заставило его участвовать в операции, забрав паспорт и телефон, несмотря на его нежелание.
Мнения

Тимур Шафир: Голливудский протест против Трампа оказался спектаклем

Том Хэнкс объявил о своем решении покинуть США после победы Дональда Трампа. Этот политический жест подчеркивал несогласие актера с новым руководством сверхдержавы. Однако уже через два дня после отъезда Хэнкс вернулся в Штаты, объяснив это фразой: «Хлопать дверью – не в моих правилах». Ну, ок.

Марина Хакимова-Гатцемайер: Чем больше размышлений о будущем ребенке, тем сложнее на него решиться

«Жизнь дорожает, в политике нестабильность, надо сначала обустроиться, обложиться финансовыми подушками». Люди с таким мышлением никогда не будут довольны собой, своей жизнью. Им всегда будет мало. Мало будет именно им, а не ребенку, которому необходимы лишь любящие родители.

Владимир Можегов: Правый поворот Европы неостановим

Если все эти умозрительные проекты (Австро-Венгрия Орбана, Ле Пен во Франции, АдГ в Германии, консервативный Юг) реализуются, то мечта Де Голля и Аденауэра о «Европе отечеств» может оказаться вновь актуальной.
Вопрос дня

«Русский индеец». Кто стал первым политбеженцем из США в Россию?