Выбор технических средств контентной фильтрации для осуществления родительского контроля: практический подход
Проблема фильтрации контента Всемирной паутины для защиты от нежелательных или вредоносных сайтов. Анализ и категоризация ресурсов. Использование систем, анализирующих содержимое Всемирной паутины и снабжающих ресурсы "ярлыками" ("категориями").
Рубрика | Программирование, компьютеры и кибернетика |
Вид | доклад |
Язык | русский |
Дата добавления | 11.05.2015 |
Размер файла | 19,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Выбор технических средств контентной фильтрации для осуществления родительского контроля: практический подход
10.02.2011
Тезисы доклада на II объединенном Форуме Безопасного Интернета, который состоялся 8 февраля 2011 г.
Проблема фильтрации контента Всемирной паутины для защиты от нежелательных или вредоносных сайтов связана с тем, что в мире, согласно данным Британской корпорации Netcraft на январь 2011 г., насчитывалось порядка 273 млн. функционирующих интернет сайтов. Средняя скорость прироста - несколько миллионов сайтов в месяц. Людские ресурсы не способны осуществить классификацию этого объема информации и отследить возникающие угрозы - абсолютного или относительного характера.
В связи с этим возникает задача регулирования доступа к интернету, мотивируемая разными причинами, и характеризуемая разнообразными параметрами. Тема настоящего форума "Интернет и дети" придает этой задаче совершенно определенную направленность.
Мы не рассматриваем здесь подход к ограничению доступа к интернету (или точнее - к Всемирной паутине), выражающийся в использовании "белых списков", когда разрешается доступ к определенному набору "проверенных" ресурсов, поскольку сформированное таким образом информационное пространство не является собственно Всемирной паутиной.
Не подвергая сомнению целесообразность и эффективность ограничений на основе "белых списков", например, для младшего школьного возраста, мы, тем не менее, концентрируем наше внимание на контентной фильтрации применительно к Всемирной паутине в общепринятом понимании, как она есть, в ее полном объеме и многообразии.
Проблему контентной фильтрации с применением технических средств мы предлагаем рассматривать в нескольких плоскостях:
1. что разрешать или запрещать, и как определять категории ресурсов Всемирной паутины,
контент всемирная паутина фильтрация
2. какой уровень достоверности отнесения ресурса к той или иной категории достижим на практике,
3. какие параметры или дополнительные признаки могут использоваться для фильтрации, помимо ограничений, связанных с конкретными категориями,
4. где именно может осуществляться фильтрация, и какие архитектурные принципы могут быть положены в ее основу
Первый и второй вопросы взаимозависимы и тесно связаны между собой.
Начнем с того, что сам список категорий, число которых в разных системах лежит между 32 и 64, может вызвать большие дискуссии. На это накладывается естественная неоднозначность отнесения ресурса к определенной категории. Это сама по себе большая тема, на которой мы не будем сейчас заострять внимание.
Главная проблема состоит в том, что произвести анализ и категоризацию контента Всемирной паутины силами экспертов невозможно в виду ее астрономического объема. Надеяться на "сигналы" пользователей также не продуктивно: например, список блокируемых ресурсов, составленный Австралийской правительственной организацией "Australian Communications and Media Authority's (ACMA)" по обращениям пользователей, за 5,5 лет вобрал лишь немногим более 3 тыс. сайтов (сравните с количеством сайтов, составляющим 273 миллиона, о котором я говорил в начале). Но даже если будет составлен список из 300 тыс. сайтов, его использование не обеспечит надежной защиты ввиду того, что составление подобного списка будет всегда очень сильно отставать от реальной картины, которая меняется ежедневно и ежечасно.
Как показывает анализ существующих систем фильтрации контента, эффективный заслон на пути вредоносного содержимого могут поставить лишь системы, автоматически анализирующие содержимое Всемирной паутины, и снабжающие все ресурсы "ярлыками" ("категориями"), например: "порнография", "азартные игры", "вредоносный сайт" (вирусы или другой вредоносный контент), "новостные", "образовательные", "бизнес-ресурсы" и пр.
Подобные системы существуют в мире, они поддерживают относительно актуальные базы данных по мировому содержимому интернета, и постоянно их обновляют, но следует учитывать, что эффективность подобных систем, хотя и высока, все же не является абсолютной.
Фильтры контента, использующие автоматически составленные базы категорий ресурсов интернета, в реальной жизни могут "ошибаться" где-то на 1% в ту или иную сторону: пропускать вредоносные сайты и блокировать безобидные, а иногда даже весьма полезные ресурсы. Блокирование "невинных" ресурсов называется "overblocking”, т.е. избыточное блокирование.
В случае как избыточного, так и недостаточного блокирования необходимо вмешательство людей - на уровне корректировки баз данных категорий у поставщиков таких баз, или на уровне локальных фильтров, когда оперативно вносятся необходимые коррекции. При любом внедрении систем фильтрации должен быть предусмотрен механизм быстрого внесения таких необходимых коррекций, а также связи с поставщиками баз, позволяющей сообщать о некатегорированных или неправильно категорированных ресурсах.
Целью вышесказанного было обратить внимание на то, что фильтрация, основанная на автоматической категоризации, не является панацеей, и предполагает некоторую зрелость и психологическую устойчивость пользователей, а с другой стороны - наличие контроля и направляющей роли старших - родителей и воспитателей. Несмотря на недостижимость абсолюта, такая фильтрация является весьма эффективной, в чем предлагаю убедиться на практике всем желающим.
При этом надо учитывать, что невозможность абсолютной фильтрации не связана с какими-то частными недоработками и недостатками подобных систем: даже на современном уровне реализации задача фильтрации контента представляет собой очень серьезный технологический вызов, требующий привлечения самых передовых в мире технологий и огромных вычислительных мощностей.
Итак, оставаясь в реальном мире, и опираясь на существующие, хотя и самые передовые технологии, рассмотрим, какими дополнительными средствами обычно снабжают свои системы фильтрации передовые поставщики систем, основанных на URL-категоризации.
Во-первых, это он-лайновые фильтры, использующие лексический анализ, контроль изображений и ряд других приемов, позволяющий отсечь нежелательные ресурсы, даже если они связаны с сайтами "разрешенных" категорий (согласно базе категоризации URL). Те же средства используются при работе с ресурсами в интросетях (всевозможные внутренние сети разных провайдеров), которые недоступны извне, и поэтому не могут быть подвергнуты категоризации обсуждаемыми средствами.
Но кто бы что ни говорил в связи с он-лайновой фильтрацией, ее возможности ограничены мощностью доступных вычислительных ресурсов и величиной допустимых дополнительных задержек, поэтому она может играть лишь вспомогательную роль. Дело в том, что при составлении и ре-актуализации баз всемирных ресурсов, поставщики таких решений могут приложить значительно большие мощности для анализа каждого URL, при этом они не связаны временными ограничениями, существующими в режиме он-лайн, поэтому такие базы имеют существенно более высокий уровень достоверности.
Следующий слой дополнительных средств - "черные" и "белые" списки, которые может вносить администратор системы фильтрации самостоятельно. Это необходимый механизм оперативного реагирования и "тонкой настройки" системы, которая может быть осуществлена в необходимых случаях.
Можно и нужно запрещать использование некоторых поисковиков, неспособных предоставлять услугу "безопасного" поиска. Другими методами воздействовать на владельцев таких ресурсов, по-видимому, невозможно.
Управляемым должен быть доступ к системам обмена мгновенными сообщениями.
Загрузка определенных типов файлов должна находиться под контролем.
Контроль доступа к социальным сетям не вызывает сомнения.
Изменение параметров доступа по расписанию также может быть полезным: например, в вечернее время, под наблюдением родителей, могут быть расширены возможности использования игровых т других развлекательных ресурсов.
Ролевое управление доступом совершенно необходимо, если компьютер используется разными членами семьи или участниками разных групп пользователей. Более того, централизованное администрирование доступа для нескольких компьютеров также крайне желательно.
Все эти и ряд других возможностей управления доступом присутствуют в развитых системах контентной фильтрации ведущих поставщиков таких решений.
Последний из рассматриваемых вопросов - о технологиях. Где и как могут быть использованы системы фильтрации рассматриваемого класса?
Теоретически существуют несколько возможностей, каждая из которых имеет свои достоинства и недостатки.
Первый подход, который напрашивается сам собой, и кажется естественным: поставить систему фильтрации на все персональные компьютеры, на которых она необходима. К сожалению, для систем рассматриваемого класса прямая реализация такого подхода проблематична. Самое главное ограничение - высокий уровень потребления вычислительных ресурсов, который может оказаться неприемлемым для персональной техники. Сюда же добавляется потребление трафика для загрузки баз категорированных ресурсов, дополнительная память, необходимая для хранения этих баз, и пр.
Поэтому реальным решением, которое сегодня существует, работает, и является доступным, стала фильтрация "в облаке", в интернете, в сети специально выделенных ресурсов. При этом на персональные компьютеры пользователей устанавливаются только специальные агенты небольшого объема, не требующие больших ресурсов и не "отъедающие" существенной доли производительности компьютера.
Эта реализация проверена временем, неоднократные испытания показали ее взломоустойчивость и практическую эффективность.
Другой подход, применимый для коллективного доступа - для школ и других образовательных и общественных учреждений - установка специальных фильтрующих серверов. При этом агенты на персональные компьютеры устанавливать не надо, главное - перенаправлять интернет-трафик на такие фильтрующие сервера. Сегодняшний уровень реализации систем фильтрации позволяет использовать в качестве таких серверов компьютеры очень невысокой мощности, примерно эквивалентные персоналкам средней производительности.
Третий подход - фильтрация на уровне провайдеров. Вполне реализуем, однако связан с рядом сложностей и ограничений.
Во-первых, персональный компьютер может иметь ряд альтернативных каналов выхода в интернет: GPRS и другие беспроводные методы доступа, которые предоставят маршруты в обход провайдеров, а значит - в обход фильтрации.
Во-вторых, доступ к функциям администрирования получается усложненным, и, следовательно, более дорогим в реализации. Правда, в последних разработках используются те же принципы, которые применяются в системах фильтрации "в облаке", что упрощает работу с системами администрирования. Но ряд вопросов, связанных с групповым управлением профилями пользователей (для организаций), остается, и, хотя соответствующие решения существуют, реализация с использованием локальных серверов фильтрации может оказаться более простой и дешевой.
Существующие проблемы с домашним / школьным интернетом:
1. Распространенные системы фильтрации контента, основанные на белых списках, накладывают неоправданные ограничения на доступ к информации, и вызывают протестную реакцию в среде детей среднего и старшего школьного возраста, выражающуюся в стремлении обойти эти ограничения. Такие стремления, как правило, успешно реализуются, что приводит к абсолютно неуправляемому и неконтролируемому, в конечном итоге - небезопасному доступу детей к интернет-ресурсам.
2. Практически поголовная неграмотность родителей в области возможностей, достоинств и опасностей интернета, элементарных правил соблюдения безопасности, не говоря уже о технических средствах управления доступом, является дополнительным фактором риска, связанным с использованием интернет неподготовленными и неуправляемыми пользователями - детьми.
Решение этих двух задач взаимосвязано: распространение технических средств управления доступом к интернет и пропаганда методов безопасного использования мировой паутины являются взаимно дополняющими направлениями, двумя сторонами одного процесса.
Размещено на Allbest.ru
Подобные документы
Понятие интернета как всемирной информационной системы, его внутренняя структура и принципы функционирования. История и основные этапы развития "всемирной паутины", характеристика предоставляемых услуг, сервисов. Оценка перспектив и тенденций расширения.
реферат [424,1 K], добавлен 28.06.2014Создание World Wide Web как единства информационных ресурсов. Разработка и внедрение технологических стандартов для Интернета и Всемирной паутины. Применение гипертекста для построения информационной среды. Использование специальной программы браузеры.
презентация [652,5 K], добавлен 09.10.2014Необходимость ввода гибкой классификации пользователей на основе их поведения при работе с тематическими ресурсами. Параметризация классов пользователей, интеллектуальный алгоритм фильтрации контента. Параметры для принятия экспертной системой решения.
статья [16,7 K], добавлен 15.11.2013Internet – объединение транснациональных компьютерных сетей, физически передающих данные по доступным типам линий: появление, современное состояние и развитие; характеристика сети Internet, протоколы, услуги. Проблема зависимости от всемирной паутины.
контрольная работа [26,7 K], добавлен 10.01.2011Сущность и содержание "всемирной паутины", использование технологии гипертекста, в которой документы связаны между собой с помощью гиперссылок. Браузеры для просмотра Web-страниц. Способы общения в Интернете. Серверы файловых архивов, их задачи.
презентация [373,0 K], добавлен 21.12.2014Интернет - глобальная телекоммуникационная сеть информационных и вычислительных ресурсов, служит физической основой для Всемирной паутины. История возникновения и развития сети интернет, основные услуги. Что такое web-браузеры, их характеристика.
дипломная работа [8,0 M], добавлен 19.08.2011Методы проектирования систем автоматического управления: экспериментальный и аналитический. Моделирование замкнутой системы управления. Системы в динамике: слежение, стабилизация, алгоритм фильтрации. Математические модели систем, воздействий, реакция.
контрольная работа [522,9 K], добавлен 05.08.2010Internet - ядро, обеспечивающее связь информационных сетей, принадлежащих различным учреждениям. Отсутствие единой авторитарной фигуры в глобальной сети. Устройство и функционирование всемирной паутины. Безопасность в Internet. Электронная почта.
презентация [267,2 K], добавлен 30.01.2011HTML5 — язык для структурирования и представления содержимого для всемирной паутины, а также основная технология, используемая в Интернете. Создание web-приложения и использованием технологии Asp.net MVC 3 и языка web-разметки HTML5. Состав платформы MVC.
курсовая работа [1,2 M], добавлен 25.05.2012SaaS как технология использования и продажи программного продукта, которая предполагает предоставление заказчику доступа к программному обеспечению посредством всемирной паутины. Общая характеристика основных факторов, способствующих продвижению SaaS.
презентация [313,3 K], добавлен 23.05.2014