«Наша программа обнаруживает высказывания, содержащие явные речевые показатели нарушения Российского законодательства. При обнаружении подобного сообщения система назначает ему штраф, а при превышении суммарного штрафа заданного порога такое сообщение считает нарушившим законодательство», - сообщила Мехонина, передает «Интерфакс».
По ее словам, база данных для программы включает в себя около 200 слов русского языка и соответствующих им словоформ.
В создании интернет-фильтра также принимала участие аспирантка механико-математического факультета вуза Лиана Ермакова, отметила Мехонина.
Создатели программы считают, что их изобретение сможет пригодиться, в частности, родителям, которые хотят оградить своих детей от нежелательного контента, а также пользователям блогосферы. Воспользоваться им смогут и сетевые СМИ, у которых нет возможности позволить себе иметь в штате модератора.
Мехонина добавила, что работа над системой продолжается, фильтр совершенствуется, и в будущем программа сможет сама классифицировать речевые элементы на основе машинного «обучения».
Разработчики уточнили, что система будет блокировать не все выражение, где фильтр обнаружит «незаконный» элемент, а лишь тот кусочек текста, в котором выявит нарушение. При этом в настройках пользователь сможет выбрать наиболее удобный режим блокирования.
«Например, брань или экстремистское высказывание может быть закрыто окошечком», - уточнила Мехонина.
Она добавила, что при работе над программой ее создателям пришлось изучить огромное количество материалов в интернете. «Благодаря этому фильтр «научился» распознавать даже видоизмененные орфографически бранные слова, которыми частенько пользуются люди в интернете, обманывая таким образом модераторов», - сказала Мехонина.
По ее словам, весной следующего года создатели фильтра планируют предложить систему в качестве апробации интернет-провайдерам. Затем она может быть выпущена в массовое потребление для частных лиц.
Научный руководитель Мехониной Владимир Салимовский отметил на пресс-конференции, что проблема нарушений законодательства и речевой культуры особо характерна для Рунета, пользователи которого, по его мнению, зачастую понимают свободу слова как возможность высказываться, пренебрегая нормами поведения и законами общества.