Информационные системы в экономике

Информация и информационные процессы в организационно экономической сфере. Понятие и содержание экономической информации, определение ее назначения, разновидности. Табличный процессор MS Excel, MS Access. Информационно-поисковые системы Интернета.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 13.03.2011
Размер файла 73,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

КОНТРОЛЬНАЯ РАБОТА

Тема: «Информация и информационные процессы в организационно-экономической сфере»

Введение

Современное человеческое общество живет в период, характеризующийся небывалым увеличением информационных потоков. Это относится как к экономике, так и к социальной сфере. Наибольший рост объема информации наблюдается в промышленности, торговле, финансово-банковской сфере. В промышленности рост объема информации обусловлен увеличением объема производства, усложнением выпускаемой продукции, используемых материалов, технологического оборудования, расширением внешних и внутренних связей экономических объектов. Рыночные отношения предъявляют повышенные требования к своевременности, достоверности, полноте информации, без которой немыслима эффективная маркетинговая, финансово-кредитная, инвестиционная деятельность. Роль информации в общественной жизни существенно меняется. Информация приобретает преобразующий, определяющий характер. Создание индустрии информатики и превращение информационного продукта в товар приводит к глубинным социальным изменениям в обществе, трансформируя его из индустриального в информационное. Информация охватывает все стороны жизни общества - от материального производства до социальной сферы. Качественно новое обслуживание информационных процессов человеческой деятельности связано с использованием современной персональной электронно-вычислительной техники, систем телекоммуникаций, созданием сетей ЭВМ. В связи с этим общество на уровне государства должно решить ряд проблем информатизации. Пути решения наиважнейших из них были определены комплексом организационных, экономических и правовых мер в Указе Президента РФ от 20 января 1994 г. «Об основах государственной политики в сфере информатизации».

1. Информация и информационные процессы в организационно - экономической сфере

1.1 Информация и данные

Любая деятельность человека основывается на информации.

Информация - сведения об окружающем мире (объектах, явлениях, событиях, процессах и т.д.), которые уменьшают имеющуюся степень неопределенности, неполноты знаний, отчужденные от их создателя и ставшие сообщениями (выраженными на определенном языке в виде знаков, в том числе и записанными на материальном носителе), которые можно воспроизводить устным, письменным или другим способом (с помощью условных сигналов, технических средств, вычислительных средств и т.д.).

В этом определении, построенном на ряде определений, для нас важно следующее:

? информация - это не любые сведения, она несет в себе нечто новое, уменьшающее имеющуюся неопределенность;

? информация существует вне ее создателя, это отчужденное от ее создателя знание; знание - отражение действительности в мышлении человека;

? информация стала сообщением, так как она выражена на определенном языке в виде знаков;

? сообщение может быть записано на материальном носителе (сообщение является формой передачи информации);

? сообщение доступно для воспроизведения без участия автора;

? она передается в каналы общественной коммуникации.

Информация позволяет организации:

? определять стратегические, тактические и оперативные цели и задачи организации;

? осуществлять контроль за текущим состоянием организации, ее подразделений и процессов в них;

? принимать обоснованные и своевременные решения;

? координировать действия подразделений в достижении целей.

Наряду с понятием «информация» распространение получило понятие «данные». В общеупотребительном смысле это синонимы, но существует достаточно строгое различие, которое заключается в том, что «информация» имеет общетеоретическое значение - «меры упорядоченности системы», а понятие «данные» сводит информацию до объекта тех или иных преобразований. В этом отношении данные представляют собой конкретные сведения (информацию в определенной форме - речевую, аудио, видео) на носителе, которые можно подвергнуть обработке, в том числе и компьютерными средствами.

Информационная потребность. Отсутствие информации вызывает информационную потребность - осознанное понимание различия между индивидуальным знанием о предмете и знанием, накопленным обществом. Процесс насыщения производства и всех сфер жизни и деятельности человека информацией называется информатизацией. Постепенно процесс насыщения приводит наше общество в такое состояние, когда общество называют информационным обществом.

Информационное общество. Это такое общество, в котором созданы все условия для удовлетворения информационных потребностей всех граждан, организации и государства; большинство работающих либо занято производством, хранением, переработкой и реализацией информации, либо не в состоянии выполнять свои производственные обязанности без этих процессов.

Информационная культура. Граждане информационного общества обладают некоторой информационной культурой - умением работать с информацией и использовать для ее получения, обработки и передачи компьютерные информационные технологии.

Информатика. Наука, занимающаяся изучением свойств информации, вопросами ее сбора, хранения, поиска, переработки, преобразования, распространения и использования в различных сферах деятельности человека, называется информатикой.

информационный табличный интернет поисковый

1.2 Понятие экономической информации

Поскольку мы имеем дело с организациями, работающими в экономической области, то нас прежде всего интересует экономическая информация.

Экономическая информация - совокупность сведений о социально-экономических процессах, служащих для управления этими процессами и коллективами людей в производственной и непроизводственной сферах. Также под экономической информацией понимается информация, характеризующая производственные отношения в обществе. К экономической информации относятся сведения, которые циркулируют в экономической системе, о процессах производства, материальных ресурсах, процессах управления производством, финансовых процессах, а также сведения экономического характера, которыми обмениваются различные системы управления.

Характеристики экономической информации:

? большие объемы;

? многократное повторение циклов ее получения и преобразования в установленные временные периоды (месяц, квартал, год и т.д.);

? многообразие источников и потребителей;

? значительный удельный вес рутинных процедур при ее обработке.

Как превратить экономическую информацию в данные

Предположим, у нас имеется некоторый объект, обладающий определенными свойствами. Мы имеем информацию об этих свойствах. Например, это может быть информация о продажах телевизоров в некотором магазине за месяц. Будем считать, что единицей экономической информации является реквизит, выражающий определенные свойства объекта, описываемого информацией. В данном случае - это продажа телевизоров.

Реквизит состоит из реквизита-признака, характеризующего качественные свойства описываемого объекта (наименование, время действия и т.д.), и реквизита-основания, дающего количественную характеристику этого объекта.

Совокупность логически связанных реквизитов-признаков и реквизитов-оснований, имеющая экономический смысл, образует показатель. Для нашего случая - это объем продаж телевизоров определенной марки. На основе показателей строятся документы, которые могут включать в себя один или несколько показателей. Документы используются в процессе управления. Группа данных из реквизитов, показателей и документов, характеризующих какой-либо объект, называется информационной совокупностью. Таким образом, информация о продажах телевизоров превратилась в данные информационной системы.

1.3 Требования к экономической информации

Свойства информации. Когда говорят об информации, то упоминают ряд ее свойств. Информация достоверна, если она не искажает истинного положения дел. Информация полна, если ее достаточно для понимания и принятия решений. Информация ясна и понятна, если она выражена языком, на котором говорят те, кому она предназначена.

В современном информационном обществе информация - это важнейший стратегический ресурс системы управления. Информационная система должна разрабатываться с учетом заданных потребительских свойств информации:

? ценность, адекватность информации;

? полнота информации для реализации управляющего воздействия;

? точность и достоверность информации;

? актуальность, своевременность и оперативность получения информации.

Ценность - мера расширения, развития тезауруса (систематизированного словаря понятий с указанием смысловых связей между ними, т.е. совокупности сведений, которыми располагает пользователь или система) воспринимаемой стороной при приеме и интерпретации сообщения, степень снижения состояния неопределенности экономического субъекта, степень продвижения к цели.

Адекватность информации - это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.

Полнота информации определяется применительно к управленческим функциям. Информация может быть неполной как по составу, так и по объему сведений. В любом случае дефицит информации приводит к невозможности выполнения функций управления в нужное время и в указанном месте в соответствующем виде.

Точность информации - это заданная степень приближения информации истинному значению показателя. В практике управления определены необходимые уровни точности информации для различных уровней и функций управления, отдельных технико-экономических показателей. Точность информации обеспечивает ее однозначное восприятие всеми потребителями.

Достоверность является вероятностной оценкой точности (безошибочности) информации, зависящей от используемых информационных технологий. Достоверность определяет допустимый уровень искажения как поступающей, так и результатной информации, при которой сохраняется эффективность функционирования системы.

Актуальность информации - это степень соответствия отражения реального состояния системы и объекта управления.

Своевременность информации характеризует временной интервал между возникновением потребности в информации и реализацией этой потребности.

Оперативность информации выражает «скорость» получения информации, отражает актуальность информации для необходимых расчетов и принятия решений в изменившихся условиях.

Актуальность связана с периодичностью получения информации, своевременность информации определяет выбор средств обработки информации, а оперативность - выбор средств сбора и передачи информации.

Информация достоверна, если она отображает истинное положение дел, полна, если ее достаточно для принятия решения. Ценность информации зависит от того, какие задачи можно решать с ее помощью. Актуальность важна при работе в постоянно меняющихся условиях.

1.4 Виды экономической информации

Экономическую информацию принято подразделять по следующим признакам: функциям управления и месту возникновения. По функциям управления экономическая информация разделяется на плановую, учетную, нормативно-справочную и отчетно-статистическую информацию.

Плановая (директивная) информация - включает в себя директивные значения планируемых и контролируемых показателей бизнес-планирования на некоторые периоды в будущем (месяц, квартал, год и т.д.). Например, план выпуска продукции в натуральном и стоимостном выражении, планируемый спрос на продукцию и прибыль от ее реализации.

Учетная информация отражает фактические значения запланированных показателей за определенный период времени. На основании этой информации может быть скорректирована плановая информация, проведен анализ деятельности организации, приняты решения по более эффективному управлению. В качестве учетной информации выступает информация оперативного, бухгалтерского, финансового учета. Например, количество деталей данного наименования, изготовленных рабочим за смену (оперативный учет), зарплата рабочего за изготовление деталей (бухгалтерский учет), фактическая себестоимость изготовленной продукции (бухгалтерский и финансовый учет).

Нормативно-справочная - содержит справочные и нормативные материалы, связанные с производственными отношениями и процессами. В общем объеме циркулирующей на фирме информации нормативно-справочная составляет 50-60%. Примеры нормативно-справочной информации: технологические нормативы изготовления деталей, стоимостные нормативы (расценки, тарифы, цены), справочные данные по поставщикам и потребителям продукции и т.д.

Отчетно-статистическая - отражает результаты фактической деятельности фирмы для вышестоящих органов управления, органов госстатистики, налоговой инспекции и т.д. Например годовой бухгалтерский баланс.

Классификация экономической информации по уровням управления включает в себя входную и выходную. Входная информация - информация, поступающая в фирму извне и используемая как первичная информация для реализации экономических и управленческих функций, а также задач управления. Выходная информация - это информация, поступающая из одной системы в другую. Одна и та же информация может являться как входной для одного структурного подразделения, так и выходной для другого.

Документы. В рамках информационной системы любой организации мы имеем дело с документами и документооборотом. Выше отмечалось отличие между понятиями информация и данные. Информацию связывают с содержанием сведений об объектах реального мира, а данные - с формой представления этих сведений в процессе их хранения и переработки. Движение информации в системе управления осуществляется в виде документов или сигналов.

Документ - информационное сообщение в бумажном, звуковом или электронном виде, оформленное по определенным правилам, заверенное в установленном порядке.

Документооборот - система создания, интерпретации, передачи, приема и архивирования документов, а также контроля за их исполнением и защиты от несанкционированного доступа.

Документ является основным носителем информации в информационной системе, состоит из логически связанных реквизитов. Форма (макет) документа определяет расположение и формат значений реквизитов.

Наиболее традиционным в информационной системе является деление документов на документы ручного заполнения и документы машинного заполнения с помощью средств вычислительной техники и программ.

Жизненный цикл документа - интервал времени от момента создания (ручным или машинным способом) до момента сдачи в архив или уничтожения. Между этими моментами осуществляется движение документа - документооборот. Происходит обработка и использование документа для целей управления.

В соответствии с содержанием операций обработки и схемой документооборота документы по отношению к конкретной задаче делятся на первичные и производные, содержащие результаты обработки.

В зависимости от функции управления, для которой используются документы, различают нормативные, плановые, учетные, расчетные, аналитические и другие виды документов. По каждой функции управления или предметным областям существует набор форм документов, в том числе унифицированных, которые обеспечивают сокращение многообразия форм документов для функций управления, использование минимально необходимого состава реквизитов в форме документа, соблюдение порядка размещения и форматов значений реквизитов в форме документа.

2. СУБД Access

Системы управления базами данных (СУБД) являются едва ли не самым распространенным видом программного обеспечения. СУБД имеют более чем тридцатилетнюю историю развития с сохранением преемственности и устойчивых традиций. Идеологическая ценность СУБД объясняется тем, что в основе программ такого рода лежит концепция модели данных, то есть некоторой абстракции представления данных. В большинстве случаев предполагается, что данные представлены в виде файлов, состоящих из записей. Структура всех записей в файлах одинакова, а количество записей в файле является переменным. Элементы данных, из которых состоит каждая запись, называются полями. Поскольку во всех записях имеются одни и те же поля (с разными значениями), полям удобно давать уникальные имена. Многие практически важные случаи хорошо укладываются в такое представление данных. Например, в отделе кадров информация о сотрудниках имеют такую природу. Сотрудников принимают на работу и увольняют, но форма личного листа по учету кадров остается неизменной для каждого сотрудника. Товарно-материальные ценности приходят и уходят, но форма инвентарной карточки остается неизменной. Число примеров без труда можно множить. Ясно, что СУБД является адекватным средством во всех случаях, когда исходную информацию можно представить в виде таблицы постоянной структуры, но неопределенной длины или в виде картотеки, содержащей неопределенное количество карточек постоянной структуры.

Все СУБД поддерживают в той или иной форме четыре основных операции:

· добавить в базу данных одну или несколько записей;

· удалить из базы данных одну или несколько записей;

· найти в базе данных одну или несколько записей, удовлетворяющих заданному условию;

· обновить в базе данных значение некоторых полей.

Большинство СУБД поддерживают, кроме того, механизм связей между различными файлами, входящих в базу. Например, связь может установиться явным образом, когда значением некоторых полей является ссылка на другой файл, такие СУБД называются сетевыми, или же связь может установиться неявным образом, например, по совпадению значений полей в различных файлах. Такие СУБД называются реляционными.

MS Access является СУБД реляционного типа, в которой разумно сбалансированы все средства и возможности, типичных для современных СУБД. Реляционная база упрощает поиск, анализ, поддержку и защиту данных, поскольку они сохраняются в одном месте. Access в переводе с английского означает «доступ». MS Access - это функционально полная реляционная СУБД. Кроме того, MS Access одна из самых мощных, гибких и простых в использовании СУБД. В ней можно создавать большинство приложений, не написав ни единой строки программы, но если нужно создать нечто очень сложное, то на этот случай MS Access предоставляет мощный язык программирования - Visual Basic for Application.

Популярность СУБД Microsoft Access обусловлена следующими причинами:

· доступность в изучении и понятность позволяют Access являться одной из лучших систем быстрого создания приложений управления базами данных;

· СУБД полностью русифицирована;

· возможность использования OLE технологии;

· интегрированность с пакетами Microsoft Office;

· поддержка WWW-идеологии;

· визуальная технология позволяет постоянно видеть результаты своих действий и корректировать их; кроме того, работа с конструктором форм может существенно облегчить дальнейшее изучение таких систем программирования, как Visual Basic или Delphi;

· широко и наглядно представлена справочная система;

· наличие большого набора «мастеров» по разработке объектов.

Запустить систему Access можно несколькими способами:

· запуск с помощью главного меню в WINDOWS;

· запуск с помощью ярлыка на рабочем столе или панели MS Office;

· открытие какой-либо базы данных автоматически запускает Access.

При наличии вопросов о Microsoft Access прежде всего необходимо попытаться найти ответы на них в документации или в справочной системе.

Исходное окно Access отличается простотой и лаконичностью. Шесть вкладок этого окна представляют шесть видов объектов, с которыми работает программа.

Запросы - это специальные структуры, предназначенные для обработки данных базы. С помощью запросов данные упорядочивают, фильтруют, отбирают, изменяют, объединяют, то есть обрабатывают.

Формы - это объекты, с помощью которых в базу вводят новые данные или просматривают имеющиеся.

Отчеты - это формы «наоборот». С их помощью данные выдают на принтер в удобном и наглядном виде.

Макросы - это макрокоманды. Если какие-то операции с базой производятся особенно часто, имеет смысл сгруппировать несколько команд в один макрос и назначить его выделенной комбинации клавиш.

Модули - это программные процедуры, написанные на языке Visual Basic. Если стандартных средств Access не хватает для удовлетворения требований заказчика, программист может расширить возможности системы, написав для этого необходимые модули или использовав готовые.

С организационной точки зрения в работе с любой базой данных есть два разных режима: проектировочный и эксплуатационный (пользовательский). Создатель базы имеет право создавать в ней новые объекты (например таблицы), задавать их структуру, менять свойства полей, устанавливать необходимые связи. Он работает со структурой базы и имеет полный доступ к базе. У одной базы может быть один, два или несколько разработчиков.

Пользователь базы - это лицо, которое наполняет ее информацией с помощью форм, обрабатывает данные с помощью запросов и получает результат в виде результирующих таблиц или отчетов. У одной базы могут быть миллионы пользователей, и, конечно, доступ к структуре базы для них закрыт.

1. Взгляните на стартовое окно базы данных. Кроме шести вкладок для основных объектов оно содержит три командные кнопки:

Открыть, Конструктор, Создать. С их помощью и выбирается режим работы с базой.

2. Кнопка Открыть открывает избранный объект. Если это таблица, то ее можно просмотреть, внести новые записи или изменить те, что были внесены ранее.

3. Кнопка Конструктор тоже открывает избранный объект, но по другому. Она открывает его структуру и позволяет править не содержимое, а устройство. Если это таблица, в нее можно вводить новые поля или изменять свойства существующих полей. Если это форма, в ней можно изменять или создавать элементы управления. Очевидно, что этот режим служит не для пользователей базы, а для ее разработчиков.

4. Действие командной кнопки Создать соответствует ее названию. Она служит для создания новых объектов. Этот элемент управления тоже предназначен для проектировщиков базы. Таблицы, запросы, формы и отчеты можно создавать несколькими разными способами: автоматически, вручную или с помощью Мастера.

3. Информационно-поисковые системы Интернета

3.1 Основные сведения

С середины 90-х годов поиск информации производился с помощью каталогов, содержащие тематические коллекции ссылок. Первый каталог - Yahoo возник в апреле 1994 г. Каталоги обеспечивали высокое качество поиска, но с ростом ресурсов и числа пользователей всемирной сети, стало очевидно, что ни один каталог не способен поддерживать свою информационную базу в сколь бы то ни было актуальном состоянии. На протяжении последних 7 лет количество сайтов в сети возросло в 10 раз и достигло 113,658,468. Самый большой на данный момент каталог: DMOZ (Open Directory Project) содержит лишь 4,830,584 сайта. Темпы роста сети постоянно увеличиваются - за последние 3 года количество ресурсов выросло в 2,5 раза [33]. В русскоязычном сегменте - в 2 раза (на данный момент - 743,883 сайтов) [34].

Рис. 1. Рост числа web-сайтов в русскоязычном сегменте

Интернет не только увеличивается в размерах - постоянно изменяется и его структура. Если в начале 90-х содержимое сети представляло собой группу гипертекстовых документов, то сейчас это динамические мультимедийные ресурсы, зачастую использующие СУБД для хранения данных. Информация может изменяться или исчезнуть столь же быстро, как появилась. Появление новых технологий настолько преобразило сеть, что в прессе уже используют новый термин: WEB 2.0.

Обеспечить более качественный поиск информации (в том числе и мультимедийной) в подобном, быстро растущем и развивающемся окружении, смогли лишь информационно-поисковые системы (далее ИПС).

Первая ИПС WebCrawler появилась в 1994 г. В то время каталоги смогли ненадолго составить конкуренцию ИПС: размеры WWW и аудитория Интернет были относительно невелики и каталоги во многом удовлетворяли требованиям пользователей. С ростом числа документов в сети, ИПС столкнулись с проблемой релевантности результатов. Если раньше конкуренция среди ИПС сводилась к размерам индекса, то теперь индексация все большего числа ресурсов уже не гарантировала более качественный поиск. Среднестатистический пользовательский запрос состоит лишь из 2,7 слов, а удовлетворять такому запросу могут сотни тысяч страниц. Просмотреть их все пользователь попросту не может - он ограничится первыми 10-15 результатами. В связи с этим все большую важность приобретает не обнаружение всех релевантных документов, а оценка их качества, обработка и представление результатов поиска.

Современные ИПС не просто ищут удовлетворяющие запросу документы. Они ранжируют их, исходя из предположения системы о качестве и важности найденного результата. С развитием ИПС все больше становятся индексы, и все больше факторов играет роль при ранжировании результатов поиска. Учитываются не только частота употребления слов запроса в документе, но и их расположение относительно друг друга, расположение внутри документа, их выделение в тексте (шрифт, гарнитура), соответствие документа тематике запроса и многое другое.

Настоящим прорывом в обеспечении наилучшего качества поиска стала ИПС Google основанная в 1998 г. Сергеем Брином и Ларри Пейджем. Превосходство Google над ближайшими конкурентами основывалось на использовании при ранжировании алгоритма PageRank. Этот алгоритм ставит в соответствие каждому проиндексированному документу сети ранг его важности (PR), основываясь на ранге ссылающихся на него документов. Ранжирование результатов поиска с учетом PR документов позволило обнаруживать и отображать в первую очередь документы-первоисточники и наиболее «авторитетные» ресурсы сети. В свою очередь, более качественный поиск сделал ИПС Google поисковым сервисом №1 в мире. На сегодняшний день Google предлагает своим пользователям более 50 разнообразных сервисов, а ее чистая прибыль на конец 2006 года превысила 3 миллиарда долларов.

Использование оценок важности документа на основе ссылочной структуры при ранжировании результатов поиска стало стандартом де-факто для большинства современных ИПС. К сожалению, алгоритмы ссылочного ранжирования являются чрезвычайно ресурсоемкими. В связи с этим было произведено множество исследований структуры WWW, ее характеристик и динамики развития.

Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска. В число составных частей конкретной информационно - поисковой системы (ИПС), кроме информационно-поискового языка, правил перевода и критерия соответствия, входят также средства ее технической реализации, массив текстов (документов), в котором осуществляется информационный поиск, и люди, непосредственно участвующие в этом поиске.

Информационно-поисковые системы в сети Интернет - на данный момент являются одним из ее краеугольных камней. Необходимость в службах, предоставляющих возможность поиска информации в Интернет, появилась сразу же после возникновения сети и на данный момент, по соотношению качества поиска и количества обработанных источников информационно-поисковые системы не имеют аналогов. Примерами подобных систем могут служить Google, MSN, Yahoo, Яндекс, Рамблер, Апорт и многие другие.

3.2 Структура и механизм работы информационно-поисковых систем

Информационно-поисковая система - это совокупность информационно-поискового языка, правил перевода с естественного языка на информационно-поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска». Сразу оговорюсь, что в данной работе рассматривается куда более узкий класс ИПС, предназначенный для поиска информации на web ресурсах компьютерных сетей. Подобные системы появились относительно недавно (порядка 10 лет) и терминология еще не устоялась. Во всех зарубежных источниках используется термин «search engines», что дословно можно перевести как «поисковая машина» или «поисковый двигатель». В российской прессе часто используется «поисковый движок» или попросту «поисковик». В то же время, и Яндекс и Рамблер всегда именовали себя «поисковыми системами», что является еще более широким понятием.

ИПС в компьютерной сети представляет собой автоматизированный аппаратно-программный комплекс, осуществляющий поиск, сбор, классификацию и хранение информации, находящейся на ресурсах сети. ИПС использует информационно-поисковый язык запросов, в соответствии с которыми происходит поиск удовлетворяющей запросу информации, ее обработка и представление. Подробнее рассмотрим ее основные функциональные части и их функционирование:

Поиск информации в сети осуществляется с помощью поискового робота (web crawler), в составе которого выделяют две подпрограммы: паук (spider) и червяк (crawler). Первая осуществляет загрузку данных с информационного ресурса, а вторая ищет в них ссылки на другие ресурсы, добавляя их в список целей паука. Подобным образом поисковый робот движется от ресурса к ресурсу сети. Чаще всего ИПС используют сразу несколько параллельно исследующих сеть поисковых роботов, распределяя нагрузку между ними.

Стоит отметить, что далеко не все данные могут быть обнаружены ИПС. Существует проблема т.н. глубокой (скрытой или невидимой) паутиной (deep/hidden/invisible web). Информация, предоставляемая ресурсами сети, может храниться в базах данных и извлекаться из нее динамически, по запросу пользователя. К тому же, часть ресурсов не предоставляют свободного доступа, требуя аутентификации клиента. И, наконец, многие ресурсы могут быть недоступны или неработоспособны в момент их посещения поисковым роботом. По различным оценкам «невидимая» часть Интернет превосходит исследованную пауками от 10 до 500 раз [2].

Скаченная информация передается программе-индексатору, в задачу которой входит разбор и классификация этих данных. Например, в гипертекстовых страницах определяются заголовок документа и текст, выделенный размером или гарнитурой шрифта, выявляется тема документа и его ключевые слова, производится автореферирование. Процесс обработки информации индексатором и называют индексацией данных ресурса. Современные поисковые системы могут также индексировать документы в форматах pdf, ps, djvu. Предпринимаются попытки индексации графических файлов, а также аудио и видео данных (вещание TV и радио в сети).

Проиндексированные данные заносятся в индекс ИПС - специализированную базу данных. Индекс может достигать огромных размеров и проектируется с учетом повышенной отказоустойчивости, обеспечивать высокую скорость поиска и извлечения данных, а также возможность их распределенного хранения и параллельной обработки. Индекс - одна из самых сложных функциональных частей ИПС и во многом от него зависит производительность всей системы [6].

Ввиду особой важности правильности проектирования индекса ИПС, мы рассмотрим структуру индекса более подробно на примере Google. На данный момент, это - самый большой индекс, он хранит данные о более чем 8-ми миллиардов документов. Все данные размещены в виртуальной распределенной файловой системе GFS - Google File System (до 2003 г. использовалась BigFiles). GFS предназначена для работы с файлами большого размера, и хранит информацию в блоках (chunk) по 64Мб. Все блоки маркируется 64-х битными идентификаторами. GFS содержит в себе кластеры, в каждом из которых выделяется главный сервер (master) и хранилища (chunkservers). Хранилища являются рабочими станциями под управлением Linux, а блоки GFS хранятся на них как обычные файлы. Главный сервер играет роль таблицы размещения файловой системы - он содержит метаданные, позволяющие найти идентификаторы блоков запрашиваемого файла и определить хранилища, в которых они находятся. Кроме того, он проверяет работоспособность хранилищ данных. GFS содержит как минимум 3 копии каждого файла в различных хранилищах, и в случае отказа одного из них, главный сервер кластера должен переадресовать запрос другому. Чтобы не допустить превращение главного сервера в «бутылочное горлышко» системы, Google использует порядка 50 кластеров, в каждом из которых находятся сотни хранилищ.

Для выполнения распределенных вычислений Google была разработана программа Workqueue, объединяющая множество серверов в одну вычислительную систему. Она предназначена для планирования задач, выделения аппаратных ресурсов, сбора статистики и результатов. Workqueue устанавливается на те же сервера, что используются в GFS, так как их вычислительные ресурсы в основном простаивают. Для упрощения программирования распределенных вычислений над огромными (порядка 100 терабайт) массивами данных в кластерах GFS была создана платформа MapReduce framefork. MapReduce - это библиотека, скрывающая от программиста процесс распределения задач между серверами кластера (map) и сбора воедино результатов их работы (reduce). Она контролирует обработку ошибок и отказоустойчивость вычислений, а также заботиться о том, чтобы сервера по возможности выполняли операции с данными, которые физически расположены на них [9], [24]. Также в Google создан реализующий концепцию MapReduce язык Sawzall, позволяющий максимально упростить программирование параллельных вычислений.

Все вышеперечисленное позволило Google спроектировать единую распределенную систему хранения и управления структурированными данными Bigteable. Эту систему используют более 60 продуктов и проектов Google. В документации Google ее никогда не называют базой данной, хотя Bigteable и выполняет схожие функции. Дело в том, что Bigteable не поддерживает реляционную модель данных. Принято считать, что Bigteable представляет собой распределенный упорядоченный многомерный массив. По сути - это таблица, заголовки строк и столбцов которой - произвольные строки, а каждая ячейка измеряется еще и по времени (timestamp).

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Интернет продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, и считают наиболее бурно развивающиеся отраслью индустрии информационных технологий

Считается, что идеальная поисковая система должна отвечать следующим требованиям:

1. Простота в использовании

2. Чётко организованный и обновляемый индекс

3. быстрый поиск в базе данных и быстрое реагирование

4. надёжность и точность результатов поиска

Таким образом, можно сказать, что рассмотренные мною поисковые системы далеки от совершенства. А нам, как пользователям остаётся только надеется, что будут появляться новые и более совершенные системы.

Заключение

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной.

В самом деле, если подумать то Интернет - это единая информационная среда, но с другой стороны это большое количество полезной информации, для поиска которой необходимо затратить много времени.

Да и не только Интернет стал толчком для создания Информационно-поисковых систем. Предприятия, заводы, на которых существуют огромные базы данных, так же нуждаются в Информационно-поисковых системах, но всё же в большей степени ИПС связаны с сетями.

Люди ещё издревле стремились, как-то упростить процесс поиска. Например, библиотека - та же система, но вот только всё делается вручную, или же любую справочную службу.

В наше время существуют большое количество систем, такие как Archie, Goopher, современные, такие как WWW, WAIS и т.д. Без пользования услугами этих систем практически нельзя найти что-либо полезное в море информационных ресурсов сети.

Список литературы

1. Бекаревич Ю., Пушкина Н. MS Access 2000 за 30 занятий. - СПб: ВНV, 2009.

2. Блотнер П., Ульрих Л. Специальное издание Micrisoft Excel 2000. - М., СПб., Киев, 2009.

3. Васина Н. И др. Информационные ресурсы Internet. - М.: Изд. РРГУ, 2008.

4. Введение в правовую информатику. Справочные правовые системы КонсультантПлюс/ Под общ. ред. Д.Б. Новикова, В.Л. Камынина. - М.: ООО НПО «Вычислительная математика и информатика», 2007.

5. Вербовецкий А.А. Основы проектирования баз данных. - М.: Радио и связь, 2008.

6. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. - СПб.: Изд-во СПбГТУ, 2006.

7. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний и интеллектуальных систем. - СПб.: Питер, 2009.

8. Горбань А.Н. и др. Нейроинформатика. - Новосибирск: Наука, 1998.

9. Дейт К.Дж. Введение в системы баз данных. - К.; М.; СПб.: Издательский дом «Вильямс», 2008.

10. Джексон П. Введение в экспертные системы. - М.: Издательский дом «Вильямс», 2001.

11. Дженнингс Р. Использование Microsoft Access 2000. - М: Издательский дом «Вильямс», 2000.

12. Додж М., Стинсон К. Эффективная работа с Microsoft Excel 2000. - СПб.: Питер, 200+.

13. Ежов А.А., Шумский С.А. Нейрокомпьютеринг и его приложения в экономике и бизнесе. - М.: Изд-во МИФИ, 2008.

14. Интернет: Энциклопедия / Под ред. Л. Мелиховой. - СПб: Питер, 2009.

15. Информатика: Базовый курс / Симонович С.В. и др. - СПб: Питер, 2007.

16. Информационные системы / Под ред. В.Н. Волковой и Б.И. Кузина. - СПб.: Изд-во СПбГТУ, 2008.

17. Информационные системы в экономике / Под ред. В.В. Дика. - М.: Финансы и статистика 2007.

18. Камынин В.Л. Методические рекомендации по проведению занятий по курсу «Правовая информатика» с изучением систем Консультант

Плюс для студентов финансовых и экономических специальностей вузов. - М.: ООО НПО «Вычислительная математика и информатика», 2009.

19. Карпов Б. Microsoft Excel 2008: Справочник. - СПб.: Питер, 2000.

Размещено на Allbest.ru


Подобные документы

  • Информационные процессы в организационно–экономической сфере, технологии и методы обработки экономической информации. Локальные и глобальные сети в экономике. Информационные системы в бухгалтерском учете и аудите, в административном управлении.

    контрольная работа [325,1 K], добавлен 02.05.2009

  • Роль информационных процессов в организационно–экономической сфере, технологии и методы обработки информации. Поисковые системы, основные программы для работы в Интернете, средства работы с электронной почтой, системы быстрого обмена сообщениями.

    контрольная работа [230,5 K], добавлен 19.02.2012

  • Понятие информации и ее свойства. Классификация экономической информации, ключевые понятия, определяющие ее структуру. Примеры использования информационных технологий в бизнесе. Экономические информационные системы, их классификация и структура.

    шпаргалка [26,5 K], добавлен 22.08.2009

  • Суммирование, вычитание двоичных чисел в ПК. Табличный процессор Excel: типы данных. Правила ввода чисел. СУБД Access: запрос с параметром (принцип работы, этапы создания). Связи между таблицами. Проектирование структуры данных. Работа с базой данных.

    контрольная работа [52,8 K], добавлен 02.01.2011

  • Знакомство с программой Microsoft Office Excel. Табличный процессор. Ввод данных в таблицу. Работа с буфером и формулами. Относительная и абсолютная адресация. Диаграммы и графики. Создание информационной системы средствами Microsoft Office Excel.

    методичка [1,9 M], добавлен 12.05.2008

  • Сущность системы поддержки принятия управленческих решений. Функции корпоративной системы SAP R3, выполнение регрессионного анализа в табличном процессоре Excel, создание в Access базы данных. Характеристика информационных служб в сети Интернет.

    контрольная работа [2,0 M], добавлен 18.02.2011

  • Анализ автоматизированных информационных технологий, применяемых в экономике. Особенности экономической информационной системы, предназначенной для поиска, хранения и выдачи информации по запросам пользователей. Поиск информации с помощью баз данных.

    курс лекций [1,4 M], добавлен 27.01.2010

  • Актуальность (своевременность) информации. Информационные ресурсы и информационные технологии. Подходы к определению количества информации. Свойства информации, ее качественные признаки. Роль информатики в развитии общества. Бит в теории информации.

    презентация [200,9 K], добавлен 06.11.2011

  • Процессы в сфере интеллектуальной деятельности (перенос информации). Информационные процессы - хранилище, снабженное процедурами ввода, поиска и размещения и выдачи информации. Общность информационных процессов в живой природе, технике, обществе.

    реферат [127,6 K], добавлен 27.02.2009

  • Понятие, хранение и обработка экономической информации. Моделирование и методы решения задач экономического содержания, сетевые компьютерные технологии. Корпоративные информационные системы, автоматизация предметных областей экономической направленности.

    курс лекций [2,9 M], добавлен 19.02.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.