Основы математической статистики

Создание методов сбора и обработки статистических данных для получения научных и практических выводов. Графическое изображение интервального вариационного ряда. Суть числовых характеристик выборки. Анализ дисперсии и среднего квадратичного отклонения.

Рубрика Математика
Вид методичка
Язык русский
Дата добавления 06.06.2019
Размер файла 178,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ, НАУКИ И МОЛОДЕЖНОЙ ПОЛИТИКИ НИЖЕГОРОДСКОЙ ОБЛАСТИ

«ШАХУНСКИЙ КОЛЛЕДЖ АГРАРНОЙ ИНДУСТРИИ»

МЕТОДИЧЕСКАЯ РАЗРАБОТКА «МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»

Составитель:

Скибардина Е.А.

Шахунья, 2019 г

Материал данной темы необходим, прежде всего, для формирования у обучающихся функциональной грамотности - умения воспринимать и критически анализировать информацию, представленную в различных формах, понимать вероятностный характер многих реальных зависимостей, производить простейшие вероятностные расчёты. Изучение основ комбинаторики и статистики позволит студенту осуществлять рассмотрение случаев, перебор и подсчёт числа вариантов, в том числе в простейших прикладных задачах. При изучении статистики и вероятности обогащаются представления о современной картине мира и методах его исследования, формируется понимание роли статистики как источника социально значимой информации и закладываются основы вероятностного мышления.

Изучение вероятностно - статистического материала продиктовано самой жизнью. Современной России нужны люди, способные принимать нестандартные решения, умеющие творчески мыслить, хорошо ориентироваться в обычных житейских ситуациях и повседневной хозяйственной, и производственной деятельности. Вероятностный характер многих явлений действительности во многом определяет поведение человека. Мы должны научиться извлекать, анализировать и обрабатывать разнообразную, порой противоречивую информацию, принимать обоснованные решения в ситуациях со случайными исходами, оценивать степень риска и шансы на успех. Современная физика, химия, биология, демография, социология, лингвистика, весь комплекс социально-экономических наук развивается на базе статистической математики.

- преподаватель математики ГБПОУ "Шахунский колледж аграрной индустрии", высшая квалификационная категория

РЕЦЕНЗЕНТЫ:

1.

Кудельникова Е.Н.- преподаватель иатематики ГБПОУ "Шахунский колледж аграрной индустрии", высшая квалификационная категория

Основы математической статистики

Статистика, строгая муза,

Ты реешь над каждой судьбой.

Никто для тебя не обуза,

Никто не обижен тобой.

В. Шефнер [13]

Раздел прикладной математики, в котором исследуются количественные характеристики массовых случайных событий или явлений, называется математической статистикой.

Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи. В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых целиком известны. Предмет теории вероятностей - свойства и взаимосвязи этих величин (распределений).

Но часто эксперимент представляет собой черный ящик, выдающий лишь некие результаты, по которым требуется сделать вывод о свойствах самого эксперимента. Наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов, полученных повторением одного и того же случайного эксперимента в одинаковых условиях.

При этом возникают, например, следующие вопросы: если мы наблюдаем одну случайную величину - как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении? Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин,- что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость?

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных -- результатах наблюдений. Первая задача математической статистики -- указать способы сбора и группировки (если данных очень много) статистических сведений. Вторая задача математической статистики -- разработать методы анализа статистических данных в зависимости от цели исследования. Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, наиболее целесообразное планирование и др.).

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, для партии деталей качественным признаком может служить стандартность детали, а количественным -- контролируемый размер детали. Иногда проводят сплошное обследование, т. е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяется сравнительно редко. Например, если совокупность содержит большое число объектов, то провести сплошное обследование физически невозможно. Предметом исследования в математической статистике является совокупность объектов, однородных относительно некоторых признаков.

Например, физическая подготовленность студентов ШКАИ; пловцы - мастера спорта России.

Генеральной совокупностью называют совокупность объектов, из которых проводится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Часто генеральная совокупность содержит конечное число объектов. Однако если это число достаточно велико, то иногда для упрощения вычислений или для облегчения теоретических выводов, допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных выборки.

Генеральной совокупностью могут быть всё население страны, месячная продукция завода, популяция рыб, живущих в данном водоёме и т.д.

Но генеральная совокупность - это не просто множество. Если интересующая нас совокупность объектов слишком многочисленна, или объекты труднодоступны, или имеются другие причины, не позволяющие изучить все объекты, прибегают к изучению какой-то части объектов

На практике обычно применяют выборочный метод, который заключается в том, что из генеральной совокупности случайным образом извлекают n элементов. Эти элементы называются выборочной совокупностью или выборкой. Количество элементов в выборке называется ее объемом. Исследователь изучает и анализирует выборочную совокупность и на основании полученных показателей делает вывод о параметрах генеральной совокупности.

Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2, . . . хn. Этот ряд называется простым статистическим рядом.

Пример: измерена масса тела 10 девочек 6 лет. Полученные данные образуют простой статистический ряд:

24, 22, 23, 28, 24, 23, 25, 27, 25, 25.

Отдельные значения статистического ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/n - относительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется вариационным рядом.

Пример: ранжированный ряд:

22, 23, 23, 24, 24, 25, 25, 25, 27, 28.

Таблица, в первой строке которой записаны все значения величины (варианты), во второй - соответствующие им частоты, называется таблицей распределения.

Пример: таблицы распределения:

Х

22

23

24

25

27

28

m

1

2

2

3

1

1

Графическим изображением таблицы распределения является полигон.

Для его построения на оси ОХ откладывают значения вариант, на оси ОУ - соответствующие им частоты. Точки с координатами (хi; mi) соединяют отрезками, полученная ломаная линия называется полигоном частот.

В том случае, если выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда. Для этого диапазон варьирования признака разбивают на несколько (5-10) равных интервалов и указывают количество вариант, попавших в каждый интервал.

Графическим изображением интервального вариационного ряда является гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой m/h. Величина m/h называется плотностью частоты. Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения.

Характеристики ряда могут быть количественные и качественные.

Количественные (вариационные) характеристики - это характеристики, которые можно выразить числами. Их подразделяются на дискретные и непрерывные.

Качественные (атрибутивные) характеристики - это характеристики, которые не выражаются числами.

Непрерывные переменные - это переменные, которые выражаются действительными числами.

Дискретные переменные - это переменные, которые выражаются только целыми числами.

Есть несколько числовых характеристик выборки:

1) Размах выборки - это разница между минимальной и максимальной вариантой. На графике - это длина области определения полигона. На графике размах равен 28-22=6.

Задача

Дана выборка: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2;1,2; 4; 2,4.

Это ряд вариантов. Расположив эти варианты в возрастающем порядке, мы получим вариационный ряд: 1,2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Среднее значение этого ряда равно 2,4.

Медиана ряда 2,25.

Мода ряда -1,2.

Дадим определения этим понятиям.

2) Медианой вариационного ряда называется то значение случайной величины, которое приходится на средину вариационного ряда (Ме).

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине. Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.

Медиана позволяет учитывать информацию о ряде данных, которую даёт среднее арифметическое и наоборот.

3) Модой вариационного ряда называют вариант (значение случайной величины), которому соответствует наибольшая частота (Мо), т.е. которая встречается чаще других.

Мода выборки - это наиболее часто встречающаяся ее варианта. На графике - это наивысшая точка или наивысшие точки, так как мода может быть и не одна. На графике мода равна 25.

Мода является наиболее приемлемым показателем при выявлении расфасовки некоторого товара, которой отдают предпочтение покупатели; цены на товар данного вида, распространённый на рынке; как размер обуви, одежды, пользующийся наибольшим спросом; вид спорта, которым предпочитают заниматься большинство населения страны, города, посёлка школы и т.д.

В строительстве существует 8 вариантов плит по ширине, и более часто применяются 3 вида:1 м. 1,2 м. и 1,5 м. По длине 33 варианта плит, но чаще других применяются плиты длиной 4,8 м.; 5,7 м. и 6,0 м., мода на плиты чаще всего встречается среди этих 3-х размеров. Аналогично можно рассуждать и с марками окон.

Моду ряда данных находят тогда, когда хотят выявить некоторый типичный показатель.

Мода может быть выражена числом и словами, с точки зрения статистики мода - это экстремум частоты.

4)Среднее значение - это такое значение, которое усредняет все различные результаты, заменяя полную, но объемную информацию одним-единственным числом. Есть три способа его нахождения.

а. Сложить все результаты, входящие в выборку и полученную сумму разделить на количество всех результатов (стандартный способ). Например: (24+22+23+28+24+23+25+27+25+25):10=24,6.

б. Каждую варианту умножить на ее кратность, сложить все полученные результаты и поделить найденную сумму на сумму всех кратностей - объем выборки (самый популярный в статистике). Например: (22·1+23·2+24·2+25·3+27·1+28·1):10=24,6.

в. Каждую варианту умножить на ее частоту, затем сложить все полученные произведения (похоже на нахождение математического ожидания). Например: 22·0,1+23·0,2+24·0,2+25·0,3+27·0,1+28·0,1=24,6.

Среднее арифметическое - это условная величина. Реально она не существует. Реально существует общая сумма. Поэтому среднее арифметическое не есть характеристика одного наблюдения; она характеризует ряд в целом.

Среднее значение можно трактовать как центр рассеивания значений наблюдаемого признака, т.е. значения, около которого колеблются все наблюдаемые значения, причём алгебраическая сумма отклонений от среднего, всегда равна нулю, т.е. сумма отклонений от среднего в большую или меньшую сторону равны между собой.

Среднее арифметическое является абстрактной (обобщающей) величиной. Даже при задании ряда только из натуральных чисел, среднее значение может выражаться дробным числом. Пример: средний балл контрольной работы 3,81.

Среднее значение находится не только для однородных величин. Средняя урожайность зерновых по всей стране (кукуруза-50-60 ц. с га. и гречиха-по5-6 ц. с га, рожь, пшеница и т.д.), среднее потребление продуктов питания, средняя величина национального дохода на душу населения, средний показатель обеспеченности жильём, средний взвешенный показатель стоимости жилья, средняя трудоёмкость возведения здания и т.д. - это характеристики государства как единой народнохозяйственной системы, это так называемые системные средние.

5) Дисперсия - оценивает степень разброса, отклонения от среднего значения, неоднородность группы. Есть два способа ее нахождения.

а. Из значения каждой варианты вычесть среднее значение, полученные разности возвести в квадрат и умножить на соответствующее значение кратности, затем сложить все полученные произведения и результат поделить на объем выборки. Например:

(222·1+232·2+242·2+252·3+272·1+282·1):10-24,62=(484+1058+1152+1875+729+784):10-605,16=608,2-605,16=3,04

б. Квадрат значений каждой варианты умножить на ее кратность, сложить все полученные результаты и поделить найденную сумму на объем выборки, затем из получившегося числа вычесть квадрат среднего значения. Например:

(222·0,1+232·0,2+242·0,2+252·0,3+272·0,1+282·0,1)-24,62=(48,4+105,8+115,2+187,5+72,9+78,4)-605,16=608,2-605,16=3,04

6) Среднее квадратичное отклонение - также оценивает степень разброса, отклонение от среднего значения и равно корню квадратному из дисперсии. Например:

=1,74

Среднее линейное отклонение, или простое среднее отклонение (обозначается ) представляет собой среднюю арифметическую из абсолютных значений отклонений вариант от средней. В зависимости от отсутствия или наличия частот вычисляют среднее линейное отклонение невзвешенное или взвешенное:

Проверим, правильно ли мы нашли среднее значение этого ряда, медиану и моду, опираясь на определения.

Сосчитали число членов, их 12 - чётное число членов, значит надо найти среднее арифметическое двух чисел записанных посередине, то есть 6 и 7-ой варианты. (2,1+2,4)\2=2.25 - медиана.

Мода. Модой является 1.2, т.к. только это число встречается 3 раза, а остальные встречаются меньше, чем 3 раза.

Среднеарифметическое значение находим так:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Составим таблицу

xi

1,2

1,3

1,8

2,1

2,4

3,0

3,2

4

5

ni

3

1

1

1

2

1

1

1

1

ni/n

3/12=1/4

1/12

1/12

1/12

2/12

1/12

1/12

1/12

1/12

Такие таблицы называют частотными. В них числа второй строки - частоты; они показывают, как часто встречаются в выборке те или другие её значения. . Найдём размах ряда: R=5-1,2=3,8; Размах ряда равен 3,8.

Относительной частотой значений выборки называют отношение её частоты к числу всех значений выборки.

Относительные частоты иначе называют частостями. Частоты и частости называют весами

В статистике широкое применение находят такие характеристики, как мода и медиана. Их называют структурными средними, т.к. значения этих характеристик определяются общей структурой ряда данных.

Иногда ряд может иметь две моды, иногда ряд может не иметь моды.

Вопросы для самоконтроля

1. Чем занимается математическая статистика?

2. В чем состоит основная задача математической статистики?

3. Что такое генеральная совокупность?

4. Что называется выборочной совокупностью (выборкой)?

5. Что называется объемом совокупности?

6. В чем польза использования выборок?

7. Результаты переписи населения, проводимой в стране, являются генеральной совокупностью или выборкой?

8. Что называют вариантами выборки?

9. Что называется частотой варианты выборки?

10. Что называется относительной частотой варианты выборки?

11. Что называют статистическим распределением выборки?

12. Какой вариационный ряд называется интервальным?

13. Как строится полигон для изображения дискретного вариационного ряда?

14. Как строится гистограмма для представления интервального вариационного ряда?

15. Как определяется среднее выборочное?

16. В чем сущность среднего арифметического?

17. По каким формулам рассчитывается выборочное среднее?

18. В чем особенность среднего квадратического отклонения?

19. По каким формулам рассчитываются выборочная дисперсия, выборочное среднее квадратическое отклонение?

20. Что такое размах выборки?

21. Как определяется и находится мода выборки?

22. Как определяется медиана выборки?

23. Как вычисляется медиана выборки?

24. Сформулировать важное свойство медианы.

Задачи

1. Абитуриенты на четырех вступительных экзаменах набрали в сумме такие количества баллов: 17, 12, 19, 16, 18, 17, 13, 13, 19, 20, 18, 13, 12, 20, 20, 13, 17, 17, 16, 19. Составьте ранжированный ряд данных.

2. Составьте таблицу распределения для выборки из задания 1.

3. Выписали месяцы рождения группы 2сб. Получился такой ряд: 3, 12, 11, 7, 10, 7, 11, 5, 12, 3, 3, 3, 12, 11, 10, 10, 7, 7, 12, 11. Составьте таблицу распределения.

4. Изобразите по данным из задания 1 полигон. Укажите моду и размах.

5. Изобразите по данным из задания 2 гистограмму.

6. В колледже культуры провели опрос: «Какой шоколадный батончик вы больше любите?» Ответы были следующие: 10 человек ответили «Пикник», 8 человек - «Твикс», 12 человек - «Сникерс», 5 человек «Марс», 9 человек «Баунти», 3 человек - «Милки Вей», 1 человек - «Несквик». Изобразите данные опроса графически.

7. Класс написал контрольную работу со следующими результатами: две двойки, четыре тройки, восемь четверок и шесть пятерок. Найти средний балл, разброс класса в оценках и сделать вывод о том, как в среднем класс справился с работой?

8. Для украшения зала к празднику «День знаний» организаторы купили шарики по разной цене: по 2 рубля 30 шариков, по 3 рубля - 30, по 4 рубля - 20, по 5 рублей - 20. Найдите среднюю цену за один шарик и разброс в цене. Изобразите данные с помощью полигона, укажите размах и моду.

9. В группе у двух человек по 9 грамот, у трех человек по 8 грамот, у четырех человек по 5 грамот и у одного человека 2 грамоты. Найти среднее количество грамот на группу, и неоднородность распределения в группе наград.

10. Оценки по дисциплине «Народный танец» за 2 семестр в группе хореографов таковы: четыре пятерки, шесть четверок, семь троек. Сделайте вывод о среднем балле и неоднородности группы.

11. В одном из магазинов перед праздником День студента была акция для студентов: возьми мороженного столько, сколько захочешь! Один из представителей торговой марки наблюдал за покупателями: сколько же штук мороженного возьмет каждый из участников акции. Результаты были такими: 1 мороженное взяли 20 человек, 2 мороженных - 30 человек, 3 мороженных - 20 человек, 4 мороженных - 15 человек, 5 мороженных 10 человек, 6 мороженных - 5 человек. Сколько мороженных в среднем взял каждый из студентов и каков разброс в их количестве?

12. Один класс написал контрольную работу со следующими результатами: две двойки, четыре тройки, восемь четверок и шесть пятерок. Другой класс написал эту же контрольную работу с такими результатами: шесть двоек, три тройки, четыре четверки, семь пятерок. Какой из классов в среднем лучше справился с работой, в каком ученики однороднее?

13. Сравните результаты итоговой аттестации двух групп:

1 группа

2

3

4

5

2 группа

2

3

4

5

2

3

4

1

2

3

3

2

Сделайте вывод по каждой группе, изобразите сравнительные данные аттестации с помощью гистограммы.

14. На мероприятии «День здоровья» каждый из участников команды делал по одному выстрелу по мишени. Р

Результаты таковы:

Группа 1ХФ

Количество очков

10

9

8

7

6

5

4

3

2

1

Количество человек

1

5

2

2

3

4

2

0

0

1

Группа 1СБ

Количество очков

10

9

8

7

6

5

4

3

2

1

Количество человек

3

4

3

1

0

0

1

1

1

6

Какая из групп показала в среднем лучше результат, а какая из групп оказалась однороднее? Покажите данные на полигоне, для каждой группы указав моду и размах.

Ответы:

7. Средний балл 3,9; разброс в оценках 0,89; класс написал контрольную работу 3,9±0,94.

8. Средняя цена 3 руб. 30 коп.; разброс в цене 1 руб. 21 коп.; размах 3 рубля; мода 2 и 3 рубля.

9. В среднее количество грамот на человека 6,4; разброс в количестве наград 4,84. статистический вариационный дисперсия квадратичный

10. 3,8 ± 0,89.

11. В среднем каждый студент взял 2,8 штук мороженного; разброс в количестве 2,06.

12. В среднем первый класс справилась лучше второго (3,9 > 3,6) и первый класс однороднее второго (0,89 < 1,54).

13. В среднем лучше показала результаты группа 1 ХФ (6,6 > 5,6) и эта группе более однородна (5,04 < 13,64). Размах для обеих групп равен 9; мода группы 1ХФ - 9, мода для группы 1 СБ - 1.

Образцы решения типовых задач

Задача 1.

На экзамене по истории студенты получили оценки:

3 4 4 4 3 4 3 4 3 5 4 4 5 5 2 3 2 3 3 4 4 5 3 3 5 4 5 4 4 4

Построить дискретный вариационный ряд распределения студентов по баллам и изобразить его графически.

Ход решения задачи:

Определяем элементы ряда распределения: варианты, частоты, частоты.

Оценка, баллы

Кол-во студентов с такой оценкой, человек

В процентах к итогу

2

2

6,7

3

9

30

4

13

43,3

5

6

20

Итого

30

100

Теперь графически изобразим дискретный ряд распределения в виде помпона распределения.

Можно сделать вывод о том, что преобладающее большинство студентов получило «4» (43,3 %).

Задача 2. 3аписать в виде вариационного ряда выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4. Представить статистическое распре деление выборки.

Решение. Объем выборки . Упорядочив элементы выборки по величине, получим вариационный ряд 2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10. Различными в заданной выборке являются элементы их частоты соответственно равны Следовательно, статистическое распределение исходной выборки можно записать в виде следующей таблицы:

2

3

4

5

7

10

3

1

2

3

4

2

Для контроля правильности записи находим

Для каждого значения варианты можно найти также относительные частоты. В этом случае таблица для статистического ряда принимает следующий вид:

2

3

4

5

7

10

Задача 3. Представить выборку в виде интервального статистического ряда:

38 60 41 51 33 42 45 21 53 60

68 52 47 46 49 49 14 57 54 59

77 47 28 48 58 32 42 58 61 30

61 35 47 72 41 45 44 55 30 40

67 65 39 48 43 60 54 42 59 50.

Решение. Объем выборки Наибольшая варианта - 77, наименьшая - 14. Найдем длину интервала по формуле (1.1):

Выбираем длину интервала 9. Интервальный статисти-ческий ряд принимает вид:

Задачи для самостоятельного решения

Задача 1. Для заданий 1-2 построить вариационный и статистический ряды. Построить полигон частот.

1. 11, 15, 12, 0, 16, 19, 6, 11,12, 13, 16, 8, 9, 14, 5, 11, 3.

2. 17, 18, 16, 16, 17, 18, 19, 17, 15, 17, 19, 18, 16, 16, 16, 18, 18.

Таблица 1.4

Границы интер-валов

2

3

6

17

10

9

3

0,04

0,06

0,12

0,34

0,2

0,18

0,06

Задача 2. Построить полигон частот по данному распределению выборки:

15

20

25

30

35

mi

10

15

30

20

25

Задача 3. Построить полигон относительных частот по данному распределению выборки:

2

4

5

7

10

0,15

0,2

0,1

0,1

0,45

Задача 4. Построить гистограмму относительных частот по данному распределению выборки:

Номер интервала

Частичный интервал

Число наблюдений, попавших в интервал

1

2 - 5

6

2

5 - 8

10

3

8 - 11

4

4

11 - 14

5

Задача 5. Ежегодно американский журнал «Fortune» публикует список наиболее богатых людей в мире с оценками их состояний в миллиардах долларов. Ниже приводим результаты одной из публикаций:

25.0, 20.9, 8.7, 7.5, 7.4, 6.0, 5.7, 5.5, 5.0, 5.0, 4.4, 4.0, 3.6, 3.4, 3.1, 3.0, 3.0, 2.9, 2.8, 2.8, 2.5, 2.5, 2.5, 2.4, 2.4, 2.4, 2.2, 2.0, 2.0, 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.5, 1.5, 1.5, 1.4, 1.3,1.3, 1.3, 1.2, 1.2, 1.2, 1.2, 1.1, 1.1, 1.1, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0.

Постройте дискретный и интервальный ряды. Начертите гистограмму относительных частот.

Задача 6. Для изучения распределения заработной платы работников определенной отрасли обследовано 100 человек. Результаты представлены в таблице.

Зарплата

(в у. е.)

Число человек

Зарплата

(в у.е.)

Число человек

190 - 192

1

200 - 202

19

192 - 194

5

202 - 204

11

194 - 196

9

204 - 206

4

196 - 198

22

206 - 208

1

198 - 200

28

208 - 210

0

Построить гистограмму относительных частот.

Задача 7. В ОТК были измерены диаметры 300 валиков из партии, изготовленной одним станком-автоматом. Отклонения измеренных диаметров от номинала (в нм) даны в таблице.

Границы отклонений

Середина интервала

Число валиков

Границы отклонений

Середина интервала

Число валиков

-30...-25

- 27,5

3

0 - 5

2,5

55

-25... -20

- 22,5

8

5 - 10

7,5

30

-20...-15

- 17,5

15

10 - 15

12,5

25

-15...-10

- 12,5

35

15 - 20

17,5

14

-10...-5

- 7,5

40

20 - 25

22,5

8

-5 ... 0

- 2,5

60

25 - 30

27,5

7

Построить гистограмму и полигон относительных частот.

Задача 8. В таблице представлены данные о месячном доходе жителя региона (в руб.) на основании выборки из 1000 жителей.

Менее 5000

5000 -10000

10000 -15000

15000 -20000

20000 -25000

Свыше 25000

58

96

239

328

147

132

Построить гистограмму и полигон относительных частот.

Указание. В качестве верхней границы последнего интервала использовать 30000.

Задача 9. Проведено исследование посещаемости популярного интернет-сайта. В течение многих часов регистрируется число посетителей, посетивших сайт в течение данного часа. Результаты исследования представлены в таблице.

Число посетителей

Количество часов

Число посетителей

Количество часов

0

12

7

103

1

108

8

24

2

316

9

13

3

551

10

2

4

632

11

0

5

492

12

0

6

273

14

0

Построить гистограмму и полигон относительных частот.

Задача 10. Результаты исследования прочности 200 образцов бетона на сжатие представлены в виде интервального статистического ряда:

Номер интервала

Частичный интервал

Число наблюдений, попавших в интервал, п.

1

190 - 200

10

2

200 - 210

26

3

210 - 220

58

4

220 - 230

64

5

230 - 240

30

6

240 - 250

14

Задача 11. Для представленной выборки составить интервальный статистический ряд. Для этого ряда построить полигон частот и гистограмму.

69 73 70 68 61 73 70 72 67 70 66 70 76 68 71 71 68 70 64 65 72 70 70 69 66 70 77 69 71 74 72 72 72 68 70 67 71 67 72 69 66 75 76 69 71 67 70 73 71 74.

Задача 12. По списку на предприятии числится 100 рабочих, которые имеют следующие разряды: 1, 5, 2, 4, 3, 4, 6, 4, 5,1,2, 2, 3, 4, 5, 3, 4, 5, 2, 1,4, 5, 5, 4, 3, 4, 6, 1, 2, 4,4, 3, 5, 6, 4, 3, 3, 1, 3, 4,3, 4, 3, 1, 2, 4, 4, 5, 6, 1,3, 4, 5, 4, 4, 3, 2, 6, 1, 2,4, 5, 3, 3, 2, 3, 6, 4, 3, 4,5, 4, 3, 3, 2, 6, 3, 3, 5, 4,4, 3, 3, 2, 1, 2, 1, 6, 5, 4,3, 2, 3, 4, 4, 3, 5, 6, 1, 5.

Составить статистический ряд распределения рабочих по разрядам. Построить полигон частот.

Задача 13. Имеются следующие данные о числе производственных подразделений на каждом из 100 сельскохозяйственных предприятий: 2, 4, 5, 3, 4, 6, 7, 4, 5, 3, 3, 4, 2, 6, 5, 4, 7, 2, 3, 4,4, 5, 4, 3, 4, 6, 6, 5, 2, 3, 4, 3, 5, 6, 7, 2, 4, 3, 4, 5,4, 6, 7, 2, 5, 3, 5, 4, 3, 7, 2, 4, 3, 4, 5, 4, 3, 2, 6, 7,6, 4, 3, 2, 3, 4, 5, 4, 3, 5, 4, 3, 2, 6, 4, 5, 7, 5, 4, 3,4, 5, 7, 4, 3, 4, 5, 6, 5, 3, 4, 2, 2, 4, 3, 7, 5, 6, 4, 5.

Составить статистический ряд распределения сельскохозяйственных предприятий по числу производственных подразделений на одно хозяйство. Построить полигон частот.

Задача 14. Найти выборочное среднее, выборочную дисперсию для статистического ряда.

-1

0

1

3

5

15

5

25

55

10

Задача 15. Найти выборочное среднее, выборочную дисперсию для интервального статистического ряда

Границы интервалов

4

5

8

14

Задача 16. Имеются следующие данные о числе производственных подразделений на каждом из 100 сельскохозяйственных предприятий: 2, 4, 5, 3, 4, 6, 7, 4, 5, 3, 3, 4, 2, 6, 5, 4, 7, 2, 3, 4,4, 5, 4, 3, 4, 6, 6, 5, 2, 3, 4, 3, 5, 6, 7, 2, 4, 3, 4, 5,4, 6, 7, 2, 5, 3, 5, 4, 3, 7, 2, 4, 3, 4, 5, 4, 3, 2, 6, 7,6, 4, 3, 2, 3, 4, 5, 4, 3, 5, 4, 3, 2, 6, 4, 5, 7, 5, 4, 3,4, 5, 7, 4, 3, 4, 5, 6, 5, 3, 4, 2, 2, 4, 3, 7, 5, 6, 4, 5.

Найти выборочное среднее, исправленную выборочную дисперсию и выборочную моду.

Задача 17. Численность населения городов России с числом жителей более 1 млн. человек на 2002 г. представлена в таблице.

Город

Население, тыс. человек

Волгоград

1013

Екатеринбург

1293

Казань

1105

Москва

10 358

Нижний Новгород

1311

Новосибирск

1426

Омск

1134

Пермь

1000

Ростов-на-Дону

1070

Самара

1158

Санкт-Петербург

4669

Уфа

1042

Челябинск

1078

Найти выборочное среднее, выборочную дисперсию, среднее квадратическое отклонение, выборочную медиану, крайние члены вариационного ряда, размах выборки.

Задача 18. Ниже приведены результаты измерения роста (в см) случайно отобранных 100 студентов:

Рост

154-158

158-162

162-166

166-170

170-174

174-178

178-182

Число студентов

10

14

26

28

12

8

2

Найти выборочное среднее, выборочную дисперсию, выборочную моду.

Задача 19. Число пассажиров компании «Смоленские авиалинии» одного из рейсов между Смоленском и Москвой за 30 дней между апрелем и маем текущего года составило:

128, 121, 134, 118, 123, 109, 120, 116, 125, 128,121, 129, 130, 131, 127, 119, 114, 124, 110, 126,134, 125, 128, 123, 128, 133, 132, 136, 134, 129.

Чему равно среднее число пассажиров в рейсе?.

Задача 20. Двадцати подросткам, отобранным случайным образом, показали блок телевизионной коммерческой рекламы о новых сортах жевательной резинки и попросили оценить рекламу в баллах от 0 до 100.

Результаты оценки дали следующие баллы:

89, 75, 59, 96, 88, 71, 43, 62,80, 92,76, 72, 67, 60, 79, 85, 77, 83, 87, 53.

Найдите выборочное среднее, выборочную дисперсию, среднее квадратическое отклонение, медиану и моду выборочного рейтинга.

Задача 21. Служба контроля Росэнерго регулярно проводит выборочные проверки оплаты ежемесячных счетов. Случайным образом отобраны 30 адресов и выявлены суммы, которые потребители должны заплатить за пользование электроэнергией (тыс. руб.):

12, 2, 3, 5, 17, 4, 9, 21, 18,6, 8, 19, 9, 25, 2, 10,16, 18, 24, 1, 11, 6, 19, 23, 14, 7, 10, 26, 30, 7.

Найдите размах, медиану и моду выборки. Постройте интервальный статистический ряд относительных частот без корректировки границ первого и последнего интервалов.

Задача 22. Дана следующая информация о двух акциях:

Состояние

экономики

Вероятность того,

что состояние

экономики будет

Возврат

по акции А

Возврат

по акции В

Плохое

0,35

5%

0%

Хорошее

0,20

6%

10%

Очень хорошее

0,45

9%

20%

Вычислите выборочное среднее, выборочное среднее квадратическое отклонение по каждой акции. Сравните их выборочные средние, выборочные средние квадратические отклонения,

Задача 23. Инженер по контролю качества продукции обнаружил в 10 партиях электроламп, произведенных заводом, следующее число бракованных изделий: 5, 3, 7, 1, 0, 6, 3, 4, 5, 2 .

Найдите среднее число (выборочное среднее) и стандартное отклонение (выборочное среднее квадратическое отклонение) бракованных ламп. Вычислите, медиану и моду.

Задача 24. На некотором предприятии собраны данные о числе дней, пропущенных работниками по болезни.

Число дней,

пропущенных

в текущем месяце

0

1

2

3

4

5

Число работников

10

17

25

28

30

27

Найдите среднее число пропущенных дней, стандартное отклонение, медиану и моду Задача 25. Чтобы выяснить, какие суммы тратят студенты второго курса в течение семестра, питаясь в кафе университета, был проведен опрос 10 случайно отобранных студентов, который дал следующие результаты: 225, 178, 272, 310, 190, 145, 150, 220, 285, 112 (данные условные).

Найдите выборочное среднее, выборочную дисперсию, медиану ряда данных.

Задача 26. Дано следующее распределение 1000 абонентов по потребляемой мощности электроэнергии (в кВт.ч)

Интервалы

мощности

5-10

10-15

15-20

20-25

25-30

30-35

35-40

40-45

45-50

Число

абонентов

3

13

70

190

290

230

130

62

12

Построить гистограмму и полигон относительных частот.

Задача 27. Ниже приводятся данные о возрастном составе безработных по Российской Федерации, зарегистрированных в службе занятости:

Безработные,

в том числе в возрасте

Мужчины

Женщины

моложе 20 лет

7,7

11,2

20 - 24 лет

17,0

18,5

25 - 29 лет

11,9

11,7

30 - 49 лет

50,9

49,5

50 - 54 лет

4,2

4,0

55 - 59 лет

5,7

3,8

старше 60 лет

2,6

1,3

Найдите выборочные средние, выборочные средние квадратические отклонения у каждого интервального вариационного ряда.

Оценка качества продукции, балл

[1 - 2)

[3 - 4)

[5 - 6)

[7 - 8)

[9 - 10]

Число случаев

3

8

36

89

45

Задача 28. Путем устного опроса изучалось качество продукции, выпускаемой фирмой и реализуемой в магазине этой фирмы. Посетители давали оценку качества по десятибалльной шкале. Были получены сводные данные.

Определить средний балл качества продукции, выборочное среднее квадратическое отклонение.

Информационные источники

1. Математическая статистика: учеб. для вузов / В. Б. Горяинов, [и др.]; под ред. B. C.

2. Зарубина, А. П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. - (Сер. Математика в техническом университете; Вып. XVI), С. 18-31.

8. Гмурман, В. Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов / В. Е. Гмурман. - М.: Высш. шк., 2003. - С. 187-191.

9. Фигурин, В. В. Теория вероятностей и математическая статистика: учеб. пособие. / В. В. Фигурин, В. В. Оболонкин // - Минск: ООО «Новое знание», 2000. - С. 132-133.

10. Гусак, А. А. Высшая математика: учебник для студентов вузов. В. 2 т. Т. 2 / А. А. Гусак. - Минск: ТетраСистемс, 2009. - С. 395-400.

11. Письменный, Д. Т. Конспект лекций по теории вероятностей, математической статистике и случайным процессам / Д. Т. Письменный. - 3-е изд. - М.: Айрис-пресс, 2008. - С. 212-218.

12. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1983

13. Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. - М.: Изд-во «Большая Российская Энциклопедия», 1999

14. Пехелецкий И.Д. Математика: учебник для студентов. - М.: Академия, 2003

Размещено на Allbest.ru


Подобные документы

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация [140,3 K], добавлен 01.11.2013

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.

    контрольная работа [212,0 K], добавлен 01.05.2010

  • Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.

    контрольная работа [108,5 K], добавлен 03.10.2010

  • Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.

    практическая работа [132,1 K], добавлен 24.05.2013

  • Нахождение вероятности того, что наудачу взятое натуральное число не делится. Построение гистограммы для изображения интервальных рядов, расчет средней арифметической дискретного вариационного ряда, среднего квадратического отклонения и дисперсии.

    контрольная работа [140,8 K], добавлен 18.05.2009

  • Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.

    творческая работа [17,8 K], добавлен 10.11.2008

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Алгоритм определения вероятности события и выполнения статистических ожиданий. Оценка возможных значений случайной величины и их вероятности. Расчет математического ожидания, дисперсии и среднего квадратического отклонения. Анализ характеристик признака.

    контрольная работа [263,8 K], добавлен 13.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.