Вероятностно-статистический подход в компьютерной обработке данных
Вероятностная структура информации. Функции распределения и плотности вероятностей. Требования к статистическим базам учета. Определение основных статистических характеристик средствами Мастера функций. Основные статистические функции Miсrоsоft Ехсеl.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 18.10.2015 |
Размер файла | 3,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Если изучаемая переменная является количественной, то можно использовать один из двух видов статистических критериев. Критерии первого вида основаны на конкретном типе распределения генеральной совокупности и оперируют параметрами этой совокупности. Такие критерии называют «параметрическими», и они, как правило, базируются на предположении о нормальности распределения значений. Непараметрические критерии не базируются на предположении о типе распределения генеральной совокупности и не используют ее параметры. Иногда такие критерии называют «свободными от распределения» (distributiоn-frее tеsts). В определенной степени это ошибочно, поскольку любой непараметрический критерий предусматривает, что распределения во всех сравниваемых группах будут одинаковыми, иначе могут быть получены ложноположительные результаты.
Существует два параметрических критерия применяемых к данным, извлеченным из нормально распределенной совокупности: t-тест Стьюдента для сравнения двух групп и F-тест Фишера, позволяющий проверить равенство дисперсий (он же - дисперсионный анализ). Непараметрических же критериев значительно больше. Разные критерии отличаются друг от друга по допущениям, на которых они основаны, по сложности вычислений, по статистической мощности и т. д. Однако наиболее приемлемыми в большинстве случаев считаются критерий Вилкоксона (для связанных групп) и критерий Манна-Уитни, также известный как критерий Вилкоксона для независимых выборок. Эти тесты удобны тем, что не требуют предположения о характере распределения данных. Но если окажется, что выборки взяты из нормально распределенной генеральной совокупности, то их статистическая мощность будет несущественно отличаться от таковой для теста Стьюдента.
Полное описание статистических методов можно найти в специальной литературе, однако, ключевым моментом является то, что каждый статистический тест требует набора правил (допущений) и условий для своего использования, и механический перебор нескольких методов для поиска «нужного» результата абсолютно неприемлем с научной точки зрения. В этом смысле статистические тесты близки к лекарственным препаратам - у каждого есть показания и противопоказания, побочные эффекты и вероятность неэффективности. И столь же опасным является бесконтрольное применение статистических тестов, ведь на них базируются гипотезы и выводы.
Для более полного понимания вопроса точности статистического анализа необходимо определить и разобрать понятие «доверительной вероятности». Доверительная вероятность - это величина, принятая в качестве границы между вероятными и маловероятными событиями. Традиционно, она обозначается буквой «р». Для многих исследователей единственной целью выполнения статистического анализа является расчет заветного значения р, которое словно проставляет запятые в известной фразе «казнить нельзя помиловать». Максимально допустимой доверительной вероятностью считается величина 0,05. Следует помнить, что доверительная вероятность - это не вероятность некоторого события, а вопрос доверия. Выставляя перед началом анализа доверительную вероятность, мы тем самым определяем степень доверия к результатам наших исследований. А, как известно, чрезмерная доверчивость и излишняя подозрительность одинаково негативно сказываются на результатах любой работы.
Уровень доверительной вероятности показывает, какую максимальную вероятность возникновения ошибки первого рода исследователь считает допустимой. Уменьшение уровня доверительной вероятности, иначе говоря, ужесточение условий тестирования гипотез, увеличивает вероятность ошибок второго рода. Следовательно, выбор уровня доверительной вероятности должен осуществляться с учетом возможного ущерба от возникновения ошибок первого и второго рода. Например, принятые в биомедицинской статистике жесткие рамки, определяющие долю ложноположительных результатов не более 5% - это суровая необходимость, ведь на основании результатов медицинских исследований внедряется либо отклоняется новое лечение, а это вопрос жизни многих тысяч людей.
Необходимо иметь в виду, что сама по себе величина р малоинформативна для врача, поскольку говорит только о вероятности ошибочного отклонения нулевой гипотезы. Этот показатель ничего не говорит, например, о размере терапевтического эффекта при применении изучаемого препарата в генеральной совокупности. Поэтому есть мнение, что вместо уровня доверительной вероятности лучше было бы оценивать результаты исследования по величине доверительного интервала. Доверительный интервал - это диапазон значений, в котором с определенной вероятностью заключено истинное популяционное значение (для среднего, медианы или частоты). На практике удобнее иметь оба эти значения, что позволяет с большей уверенностью судить о применимости полученных результатов к популяции в целом.
В заключение следует сказать несколько слов об инструментах, которыми пользуется специалист по статистике, либо исследователь, самостоятельно проводящий анализ данных. Давно ушли в прошлое ручные вычисления. Существующие на сегодняшний день статистические компьютерные программы позволяют проводить статистический анализ, не имея серьезной математической подготовки. Такие мощные системы как SРSS, SАS, R и др. дают возможность исследователю использовать сложные и мощные статистические методы. Однако далеко не всегда это является благом. Не зная о степени применимости используемых статистических тестов к конкретным данным эксперимента, исследователь может провести расчеты и даже получить некоторые числа на выходе, но результат будет весьма сомнительным. Поэтому, обязательным условием для проведения статистической обработки результатов эксперимента должно быть хорошее знание математических основ статистики.
3.2 Статистические функции Miсrоsоft Ехсеl
В состав Miсrоsоft Ехсеl входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Другие средства позволяют представить результаты анализа в графическом виде.
Графические изображения используются, прежде всего, для наглядного представления статистических данных, благодаря ним существенно облегчается их восприятие и понимание. Существенна их роль и тогда, когда речь идет о контроле полноты и достоверности исходного статистического материала, используемого для обработки и анализа.
Статистические данные приводятся в виде длинных и сложных статистических таблиц, поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и ошибки.
В процессе анализа данных, как правило, присутствуют следующие основные этапы:
1. Ввод данных
Введенные данные обычно отражаются в форме электронной таблицы или матрицы данных, где столбцы представляют различные переменные (например, рост, вес), а строки - измерение значений этих переменных, произведенные в различных условиях, в различное время, у различных объектов и т.п.
2. Преобразование данных
Данные в электронной таблице можно просмотреть и скорректировать методами ручного редактирования или же полуавтоматического преобразования к виду, адекватному выбранному методу анализа. Здесь может быть использован широкий набор алгебраических, матричных, структурных преобразований, а также комбинирование этих операций в требуемой последовательности.
3. Визуализация данных
На данные обязательно следует просто посмотреть, чтобы составить общее (в том числе и интуитивное) представление о характере их изменения, специфических особенностях и закономерностях, что очень важно при выборе стратегии и тактики дальнейшего анализа. Для этого можно использовать как исходное числовое представление, так и различные формы графического изображения.
4. Статистический анализ
Собственно выбор метода, анализ данных и интерпретация результатов.
5. Представление результатов
Для наглядности производимых выводов полученные результаты желательно представлять в виде адекватных, убедительных и эффектных графиков.
Для успешного применения процедур анализа необходимы начальные знания в области статистических и инженерных расчетов, для которых эти инструменты были разработаны
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и дисперсионного анализа.
При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией.
Возможность использования формул и функций является одним из важнейших свойств программы обработки электронных таблиц. Это, в частности, позволяет проводить статистический анализ числовых значений в таблице.
Текст формулы, которая вводится в ячейку таблицы, должен начинаться со знака равенства (=), чтобы программа Ехсеl могла отличить формулу от текста. После знака равенства в ячейку записывается математическое выражение, содержащее аргументы, арифметические операции и функции.
В качества аргументов в формуле обычно используются числа и адреса ячеек. Для обозначения арифметических операций могут использоваться следующие символы: + (сложение); - (вычитание); * (умножение); / (деление).
Формула может содержать ссылки на ячейки, которые расположены на другом рабочем листе или даже в таблице другого файла. Однажды введенная формула может быть в любое время модифицирована. Встроенный Менеджер формул помогает пользователю найти ошибку или неправильную ссылку в большой таблице.
Кроме этого, программа Ехсеl позволяет работать со сложными формулами, содержащими несколько операций. Для наглядности можно включить текстовый режим, тогда программа Ехсеl будет выводить в ячейку не результат вычисления формулы, а собственно формулу.
Программа Ехсеl интерпретирует вводимые данные либо как текст (выравнивается по левому краю), либо как числовое значение (выравнивается по правому краю). Для ввода формулы необходимо ввести алгебраическое выражение, которому должен предшествовать знак равенства (=).
Ввод формул можно существенно упростить, используя маленький трюк. После ввода знака равенства следует просто щелкнуть мышью по первой ячейке, затем ввести операцию деления и щелкнуть по второй ячейке.
3.3 Описание программы Miсrоsоft Оffiсе Ехсеl для статистической базы учета и анализа деятельности школы
Программа Miсrоsоft Оffiсе Ехсеl позволяет вводить базовые данные об учебном заведении, создавать банки данных по кадровому составу и контингенту учащихся, обрабатывать информацию для получения выходных документов, вести электронные варианты книг приказов. Несомненно, на первых порах, требуется много времени для создания банков данных, но при работе в многопользовательском режиме временные затраты существенно уменьшаются. При наличии соответствующих модулей система может быть использована в работе директора, секретаря, завучей, учителей-предметников и классных руководителей, школьного бухгалтера, библиотекаря, медперсонала.
В электронной таблице информация отражает общую картину по всей школе. Очевидно, что при каждом изменении внутри класса, достаточно только добавить или удалить строку в файле, содержащем список учеников, автоматически произойдут соответствующие изменения во всех сводных таблицах. На итоговой таблице мы получим точную информацию на сегодняшний день.
Перечень возможных вариантов использования стандартной программы Miсrоsоft Ехсеl ХР для решения традиционных задач управленческой деятельности администрации школы.
1. Составление плана работы школы
2. Анализ урока
3. Анализ результатов УВП за учебный период, учебный год.
4. Составление табеля учета рабочего времени педагогов, руководителей кружков, работы учителей с больными учащимися индивидуально на дому.
Табель учета работы преподавателей с учащимися, обучающимися индивидуально на дому.
Табель учета пропущенных уроков педагогическими работниками за учебный год по месяцам. Подсчет числа рабочих дней в месяце, дней к оплате в аванс, дней к оплате за месяц, число дней пропущенных по болезни проводится автоматически программой Ехсеl. * Табель учета рабочего времени учителей (аванс, табель к концу месяца, табель Ехсеl за месяц с указанием всей выработанной учителем нагрузки, ГПД, работы руководителей кружков, приказы на замену замещенных уроков и т.д.)
5. Составление расписания учебных занятий.
На рисунке указано не только расписание уроков, но и отмечены условными знаками фамилии педагогов, уровень сложности по каждому предмету (в баллах), ведется автоматический подсчет количества уроков в день. Таблица с расписанием уроков напрямую связана с графиками распределения уровня трудности по каждому классу в течение учебной недели (выстраиваются согласно расчетов сводной таблицы). Программа позволяет автоматизировать выполнение значительной части работы, освобождает от переписывания, позволяет оперативно анализировать расписание относительно соблюдения санитарно-гигиенических норм, представлять результаты анализа в графической форме, производить масштабирование выходного документа, корректировать расписание, выполнять работу на высоком графическом уровне.
6. Документы по комплектованию и тарификации образовательного учреждения:
* учебный план,
* классы-комплекты,
* распределение учебной нагрузки среди педагогов (документ связан с документами «Учебный план», «Комплектование педагогов», «Тарификация педагогов»),
* тетради комплектования и тарификации,
Подготовка данного пакета документов всегда занимает много времени и связана в основном с переписыванием. Листы, на которых приходится работать очень большие, и не удобны в работе и хранении. Много времени занимает подсчет и сверка часов, здесь это делает машина. Обсчитывать такую тарификацию бухгалтер обсчитывает на машине, вводя формулы. В течение года при изменении тарификации можно использовать функцию копирования, устраняя работу по переписыванию и выполняя работу быстрее.
7. Составление статистических таблиц и аналитических справок по инспекционно-контрольной деятельности заместителя директора - справка по проверке классных журналов, справка по проверке тетрадей, анализ результатов государственной итоговой аттестации за несколько лет, статистические отчеты.
Очевидно, что, используя эти и другие операции стандартной программы (Ехсеl), можно хранить и обрабатывать информацию по контингенту сотрудников
Технология работы с электронными таблицами, создаваемыми в среде табличного процессора MS Ехсеl, сегодня столь же популярна, как и технология создания текстовых документов. Электронная таблица позволяет производить расчеты по формулам, представлять данные в виде диаграмм, структурировать данные, делать выборку из больших таблиц, создавать консолидированные таблицы и др. Использование возможностей современных информационных технологий позволяет автоматизировать процесс обработки результатов рубежных, тематических, итоговых проверочных работ
Отслеживать их динамику, представлять результаты в наглядном виде, используя возможности мастера диаграмм
Это, в свою очередь, создает условия для своевременной корректировки содержания и методики обучения, целенаправленного достижения образовательного стандарта.
Организация работы с использованием информационных технологий позволяет повысить культуру труда, качество и оформление выходного информационного продукта, интенсифицировать труд заместителя директора. Ускорение обработки информации становится возможным вследствие создания базы данных, хранения, корректировки и оперативного извлечение информации. Значительно повышается культура оформления работ, появляется возможность представления документации в текстовом и в графическом вариантах, в необходимом для работы масштабе. Сокращается объём выполнения однообразной работы, основанной на переписывании информации и внесении незначительных изменений через автоматизацию процессов обновления информации, создание и использование шаблонов.
ЗАКЛЮЧЕНИЕ
В современном обществе к статистическим методам проявляется повышенный интерес как к одному из важнейших аналитических инструментариев в сфере поддержки процессов принятия решений. Статистикой пользуются все- от политиков, желающих предсказать исход выборов, до предпринимателей, стремящихся оптимизировать прибыль при тех или иных вложениях капитала. Большим шагом вперёд к развитию статистической науки послужило применение экономико-математических методов и использование компьютерной техники в анализе социально-экономических явлений.
Программа обработки электронных таблиц MS Ехсеl- мощная и достаточно простая в использовании программа, предназначенная для решения широкого круга планово-экономических, учетно-статистических, научно-технических и других задач, в которых числовая, текстовая или графическая информация с некоторой регулярной, повторяющейся структурой представлена в табличном виде.
Программа MS Ехсеl предоставляет богатые возможности создания и изменения таблиц, которые могут содержать числа, тексты, даты, денежные единицы, графику, а также математические и иные формулы для выполнения вычислений.
Предусмотрены средства представления числовых данных в виде диаграммы, создания, сортировки и фильтрации списков, статического анализа данных и решения оптимизационных задач.
В данной работе я постараюсь показать, какие возможности для обработки статистических данных имеет программа MS Ехсеl.
Разработка нескольких видов таблиц программы MS Ехсеl в заданной предметной области - это была основная цель моей дипломной работы.
Достижение цели подтверждается наличием разработанных программ, а также описанных и смоделированных таблиц программы MS Ехсеl для статистической базы учета и анализа деятельности школы.
Также во введении были сформулированы задачи, давшие общее направление исследованию. В рамках решения поставленных задач, выполнено следующее:
Проанализирована предметная область, а именно понятие и особенности использования программы MS Ехсеl в профессиональной деятельности школьного администрирования. Проведенный анализ позволил сделать определенные выводы, подробно описанные в первой и во второй главах дипломной работы. Резюмируя, считаю целесообразным повторить тот факт, что данная программа позволит освободить заместителя директора от монотонной работы по механическому подсчитыванию, а так же предупредит возможность возникновения арифметических ошибок. Кроме того, большие объемы статистической информации станут для управленца действительно материалом для анализа и основой для принятия правильного управленческого решения.
Проанализированы и обобщены требования, предъявляемые к программе MS Ехсеl. В результате проведенного анализа сформулирован ряд требований, которые я постарался максимально учесть при дальнейшей работе по созданию различных видов таблиц программы MS Ехсеl.
Изучены общие принципы моделирования информационных систем. Работа по решению этой задачи, по сути, велась мною на протяжении всего периода обучения по специальности «Информационные системы», однако, для создания реальных работоспособных таблиц мне потребовались дополнительные знания по данному вопросу.
Результатом исследований, проведенных в рамках выполнения дипломной работы стали разработанные различных видов таблиц программы MS Ехсеl.
В дальнейшем планирую развивать выбранную тему и создать единую систему работы аналитической деятельности администрации и учителей на новом, более высоком, уровне. Это позволит сформировать единое информационное пространство школы в электронном виде.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1. Бернс Дж., Берроуз Э. ,Секреты Ехсеl 97. - М.:Веста, 1999.
2. Фигурнов В. Э. ,IBM РС для пользователя. - М.:ИНФРА, 1998.
3. А. Гончаров «Miсrоsоft Ехсеl 7.0 в примерах» - С.-П.:Питер, 1996
4. Пробитюк А., Ехсеl 7.0 для Windоws 95 в бюро. - К.:BHV, 1996
5. Лаврёнов С.М.,Ехсеl: сборник примеров и задач-М: финансы и статистика,2000.-336с.
6. Макарова Н.В.,Трофимец В.Я., Статистика в Ехсеl:учеб. пособие.-М.:финансы и статистика,2003.-386с.
7. Сидоров М.Г., Обработка данных в Ехсеl //информатика и образование.-2000.-№6.-с. 25-36.
8. Гутовская Г.В., Использование Ехсеl для решения финансово-экономических задач//информатика и образование.-2003.-№3.-с. 15-21.
9. Ивинская Н.Л., решение прикладных задач в Ехсеl//информатика и образование.-2003.-№6.-с.62-64.
10. Кирей Е.А., Базовый курс Ехсеl для учащихся профильных экономических классов//информатика и образование.-2004.-№5.-с.39-41.
11. Городецкий А.Я. Статистический анализ и синтез фотонных систем. СПб.: Изд-во СПбГТУ, 1996.
12. Городецкий А.Я., Заборовский В.С. Информатика. Фрактальные процессы в компьютерных сетях. СПб.: Изд-во СПбГТУ, 2ооо.
13. Пугачев В.С., Казаков И.Е., Евланов Л.Г. Основы статистической теории автоматических систем. М.: Машиностроение, 1974.
14. Свешников А.А. Прикладные методы теории случайных функций. М.: Наука, 1969.
15. Большаков И.А., Ракошиц В.С. Прикладная теория случайных потоков.
16. М.: Сов.радио, 1978.
Размещено на Allbest.ru
Подобные документы
Применение технических средств компьютера для решения широкого круга задач. Программы для обработки табличных данных. Пользовательский интерфейс и расширение базовых возможностей Ехсеl: формулы и функции, гиперссылки, построение диаграмм и графиков.
контрольная работа [27,5 K], добавлен 31.08.2010Назначение программы учета вычислительной техники и оргтехники организации. Характеристика входной и выходной информации. Требования к базам данных и приложению. Проектирование отношений сущность-связь. Описание операторов создания базы данных.
курсовая работа [1,7 M], добавлен 16.06.2022Обработка распределенных данных и запросов. Многопотоковые и многосерверные архитектуры. Основные типы параллелелизма при обработке запросов. Структура компонентов поддержки удаленного доступа. Доступ к базам данных в двухзвенных моделях клиент-сервер.
презентация [123,1 K], добавлен 19.08.2013Функции Microsoft Excel - встроенные инструменты, которые применяются в формулах. Их виды и основы работы с ними. Организация обработки табличных данных при помощи статистических функций. Примеры решения различных задач при помощи электронных таблиц.
курсовая работа [958,6 K], добавлен 21.07.2011Оценка неизвестной функции распределения величины или ее плотности распределения вероятности. Алгоритм основной программы, функции для построения графика исходного массива, гистограммы и графика функции Лапласа. Результат обработки сейсмического сигнала.
курсовая работа [194,4 K], добавлен 16.12.2012Зависимость функций плотности вероятности, кумулятивного и обратного кумулятивного распределений от их параметров. Представление примеров вычисления вероятностей и доверительных интервалов. Рассмотрено нормального, логнормального, бинарного распределения.
курсовая работа [377,0 K], добавлен 28.07.2012Запросы к базам данных: SQL, QBE, UDF, транзакции. Создание таблиц в системе управления базами данных MS Access, определение основных свойств полей. Проектирование базы данных "ТМЦ". Создание файла базы данных в MS Access, конструкторы и мастера.
контрольная работа [1,6 M], добавлен 15.03.2011Статистическая аппроксимация законов распределения. Основные теоретические сведения теории классификации. Алгоритмы параметрической аппроксимации функции плотности распределения вероятностей. Апробация и применение средств автоматизации в виде макросов.
дипломная работа [5,0 M], добавлен 23.08.2009Процесс создания видеофильма, публикация его в Интернете. Регламентирование трудовой деятельности мастера по обработке цифровой информации, его должностные обязанности, ответственность и права. Организация рабочего места оператора, его разделение на зоны.
реферат [2,9 M], добавлен 19.01.2014Математическая статистика. Выборочная функция распределения. Использование инструментов Мастера функций и Пакета анализа Excel при статистической обработке данных. Анализ однородности выборки. Корреляционный, регрессионный анализ экспериментальных данных.
курсовая работа [473,6 K], добавлен 22.12.2015