Распространение сигналов на семантических сетях

Исследование распространения сигналов на семантической сети русского языка на примере решения психологических тестов Медника. Подготовка к использованию в исследовании сети свободных ассоциаций русского языка. Возможные механизмы решения тестов Медника.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 15.09.2020
Размер файла 603,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Московский институт электроники и математики им. А.Н. Тихонова

Выпускная квалификационная работа - магистерская диссертация

по направлению 01.04.02 Прикладная математика и информатика

Распространение сигналов на семантических сетях

Студент Е.С. Патрушева

Научный руководитель

к. ф.-м. н., доцент М.В. Тамм

Москва 2020

ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Московский институт электроники и математики им. А.Н. Тихонова

ЗАДАНИЕ на выполнение магистерской диссертации

студенту группы ММКТ181 Патрушевой Екатерине Сергеевне

1. Тема работы

Распространение сигналов на семантических сетях

2. Цель работы

Исследовать распространение сигналов на семантической сети русского языка на примере решения психологических тестов Медника

3. Формулировка задания

? Получить и подготовить данные о сложности русскоязычных тестов Медника

? Совместно с другими студентами из группы получить и подготовить к использованию в исследовании сеть свободных ассоциаций русского языка

? Сформулировать ряд гипотез о возможных механизмах решения тестов Медника (прямые ассоциации, цепочки ассоциаций и т.д.) и об индуцируемой этими механизмами связи сложности тестов Медника с взаимным расположением слов-символов и слова-отклика на сети ассоциаций.

? Проверить предложенные гипотезы.

Проект ВКР должен быть предоставлен студентом в срок до «15» декабря 2019 г.

Научный руководитель ВКР «13» декабря 2019 г. ______________ М.В. Тамм тест медник сигнал семантический

Первый вариант ВКР предоставлен студентом в срок до «15» марта 2020 г.

Научный руководитель ВКР «15» марта 2020 г. ______________ М.В. Тамм

Итоговый вариант ВКР предоставлен студентом в срок до «12» мая 2020 г.

Научный руководитель ВКР «12» мая 2020 г. ______________ М.В. Тамм

Задание выдано студенту «20» ноября 2019 г. ______________ М.В. Тамм

Задание принято к исполнению студентом «20» ноября 2019 г. ______________ Е.С. Патрушева

Аннотация

В данной работе рассмотрены результаты тестирования Медника на русском языке. Предложена оценка сложности тестов. Найдена взаимосвязь между сложностью троек и их расположением на семантической сети.

Annotation

In this research paper I consider results of Remote Associates Test in Russian language. I have calculated difficulty estimate for each Mednick's triads. In addition, correlation between complexity of triples and their location on the semantic network has been found.

Оглавление

1. Введение

2. Подготовка данных

3. Карта слов

4. Гипотеза №1: линейное распространение в 1 шаг

5. Гипотеза №2: линейное распространение в несколько шагов

6. Дополнение к линейному распространению

7. Гипотеза №3: нелинейное распространение

8. Вывод

Литература

Приложение

1. Введение

В психологии широко известен тест вербальной креативности Медника или, как его еще называют, тест отдаленных ассоциаций (RAT) [1-2], придуманный Сарноффом Андреем Медником в 1962 г. Испытуемому дается словесная тройка, например, {дым, игра, меч}, для которой необходимо найти слово-решение (общую устойчивую ассоциацию) {огонь}, которое образовывало бы некоторое словосочетание с каждым из слов триады. При этом образование таких словосочетаний может происходить единообразно, а может и абсолютно по-разному (тестирующий может налагать на это ограничения). Высокая скорость нахождения общей ассоциации и ее уникальность свидетельствуют об успешном прохождении тестирования, т.е. о высокой степени креативности мышления. Тройки подбираются таким образом, чтобы все испытуемые были в равных условиях, т.е. нет привязки к какой-либо узкой области. Многие психологи пытаются привнести что-то свое в этот тест, начиная с простого ограничения по времени и заканчивая снятием биологических показателей [3]. Все это делается для того, чтобы понять, как устроено человеческое мышление. Более сложные опыты помогают выявить более тонкие закономерности.

В свою очередь, до сих пор до конца не понятны механизмы нахождения общей ассоциации: влияет ли на это каждое из слов тройки или же какому-то из слов отдается предпочтение и идет перебор его ассоциаций. Если испытуемый выделяет какое-то из слов триады, то каким из методов он приходит к ответу, берет первую ассоциацию к данному слову или все же пытается строить ассоциативные цепочки? Эти и многие другие гипотезы я постараюсь проверить в своей работе.

Кроме того, не вполне понятно, чем определяется сложность тестов Медника. Целью нашего исследования является поиск связи между сложностью заданий в эксперименте Медника и взаимным расположением слов-стимулов и слова-ответа на сети свободных ассоциаций. Мы располагали сырыми данными о структуре сети свободных ассоциаций русского языка и о результатах психологических экспериментов по решению тестов Медника. Доступные нам экспериментальные данные получены в ИПИ РАН в группе профессора А. Поддъякова. О каждом испытуемом известны пол, возраст, степень и профиль образования. Кроме того, постановка эксперимента в этом случае имела одну дополнительную особенность: для каждого слова-ответа существовало не три, а четыре возможных стимула, так что имелась возможность выбрать три из них четырьмя разными способами. Таким образом, можно сказать, что каждая тройка существовала в этом эксперименте в 4 разновидностях, испытуемые получали одну из них случайным образом. Наличие такого варьируемого состава троек, как предполагается, может позволить более детально понять механизм поиска общей ассоциации.

В данной работе будут рассмотрены результаты тестирования Медника на русском языке, полученные в ИПИ РАН. Результаты тестов пройдут всю необходимую обработку. Для каждой из троек будут рассчитаны количественные характеристики, которые помогут оценить сложность тройки. Помимо всего прочего будет проверено несколько предположений о зависимости сложности тройки от ее положения на семантической сети.

2. Подготовка данных

Мною были рассмотрены данные о решении тестов Медника 68 респондентами разных возрастов мужского и женского пола, каждый из которых получил 24 тройки-стимула. Поскольку каждая тройка существовала в 4 различных вариантах (см. введение), каждый вариант теста был предложен 17 испытуемым. Для каждого испытуемого и каждой тройки были известны время решения в миллисекундах, ответ и его правильность (верно/неверно/нет ответа).

Перед началом исследования полученные данные прошли чистку и предварительную обработку, а также были сгруппированы по тройкам при помощи языка программирования Python и средств Excel (см. Приложение).

Для дальнейшего анализа необходимо каким-то образом количественно описать сложность каждого теста. В качестве возможных оценок сложности теста были рассмотрены такие характеристики, как доля решивших, среднее обратное время решения, а также более общее, зависящее от параметра , среднее ( - время решения тройки в минутах), которое при переходит в среднее обратное время решения, а при - в среднюю долю решивших. Важно отметить, что разброс времен решения для одной и той же тройки очень велик. Была поставлена задача выяснить, существует ли оптимальное значение при котором относительная дисперсия минимальна, т.е. характеристика сложности тройки лучше всего определена. С уменьшением параметра наблюдалось уменьшение дисперсии (от 0,333 при до 0,076 при ), при этом предельное значение так и не было найдено. Таким образом оказалось, что самая устойчивая характеристика сложности тройки - это доля решивших.

Тем не менее, представляется, что обратное время решения, хоть и является сильно флуктуирующей характеристикой, все же содержит важную дополнительную информацию о сложности тройки. В связи с этим в дальнейшем предполагается использовать в качестве основной характеристики сложности тройки произведение средней доли решивших и среднего обратного времени решения (см. Приложение: Табл. 1). Ниже приведен график зависимости этих двух величин (Рис. 1), коэффициент корреляции составил 0,939

Рис. 1 Диаграмма рассеяния для доли правильно решивших и среднего обратного времени решения

Чем больше будет значение такой характеристики, тем проще тройка для решения испытуемым.

3. Карта слов

«Карта слов» - это масштабный интернет-проект по созданию базы данных различного рода семантических связей между словами и выражениями в русском языке (пример в английском языке [4]). Непрерывный сбор новых данных происходит в интерактивном формате при помощи сайта проекта kartaslov.ru. Пополнение сети ассоциаций [5] происходит следующим образом: в форме игры посетителю сайта предлагается ввести все возникшие за отведённое время ассоциации, так называемые отклики, на заданное слово-стимул. Образовавшимся связям присваивается вес, обратно пропорциональный их числу, веса одинаковых связей, полученных от разных участников, суммируются.

Данный подход к сбору данных имеет определенные недостатки. Во-первых, веса в такой сети распределены очень неравномерно, поскольку через каждый стимул проходит разное число человек, к тому же каждый испытуемый никак не ограничен в количестве ассоциаций, найденных для каждого слова. Во-вторых, автоматический сбор данных не позволяет наложить ограничения на формат откликов, гарантирующие их единообразие, поэтому отклики в ассоциативной сети «Карта слов» могут принимать различные словоформы (разные число, падеж, род), а в отдельных случаях являются целыми словосочетаниями. При этом в качестве стимулов используются лишь основные формы слов. Это различие между форматами слов-стимулов и слов-ответов необходимо тем или иным образом учесть для того, чтобы сделать сеть пригодной для дальнейшего анализа методами теории сложных сетей.

Мы приняли решение рассматривать в качестве элементарного объекта, узла сети ассоциаций, не словоформу, а слово в целом, во всем многообразии его форм. В связи с этим встала задача о «склейке» различных словоформ в массиве экспериментальных данных. Моя коллега, Софья Толстоухова, произвела всю необходимую предобработку данных посредством таких библиотек Python, как NetworkX и Pymorphy, пытаясь устранить уже упомянутые недостатки метода сбора данных. Была определена доля вершин (стимул/отклик), выраженных словосочетаниями - выяснилось, что таких вершин в сети всего 4%, поэтому было принято решение пренебречь ими и исключить их из общего массива данных. Вследствие этого плотность сети увеличилась приблизительно в два раза, хотя по-прежнему осталась невелика: против первоначальных . Затем слова были приведены в нормальную форму, а совпадающие вершины были «склеены» (плотность сети возросла до ). К тому же были произведена работа с петлями и мультиребрами, которые образовались вследствие языковых преобразований. В итоговой сети 29489 вершин и 582149 ребер.

Я выражаю огромную благодарность Софье за подготовку сети, в дальнейшем она будет использоваться для поиска взаимосвязи между сложностью троек Медника и их расположением на семантической сети.

Для характеризации тройки на сети были взяты следующие статистики:

a.

-

максимальный in-вес для вершины (общей ассоциации)

b.

-

суммарный in-вес для вершины

c.

-

максимальный out-вес для вершины (общей ассоциации)

d.

-

суммарный out-вес для вершины

где - вес связи между вершинами и , элемент матрицы смежности для сети «Карта слов»

В сети было найдено 62 тройки, при этом 22 их них не имеют смежных вершин. Для данных троек были рассчитаны характеристики , , и , некоторые из них оказались нулевыми. Самое большое значение = 0,0878 было у тройки {дым, игра, меч} огонь, а самое маленькое (0) {вопрос, бес, Адам} ребро. В свою очередь максимальным значением = 0,1175 обладает тройка {мальчик, дамский, облизать} пальчик, а наименьшим (0) {древо, собираться, течение} мысль.

4. Гипотеза №1: линейное распространение в 1 шаг

Давайте попытаемся разобраться в том, как происходит процесс нахождения общей ассоциации. Логично предположить, что испытуемый рассматривает каждое слово тройки по отдельности, пытаясь подобрать к нему как можно больше ассоциаций. Когда находится некоторое слово, которое ассоциируется с каждым из 3х слов, можно считать, что ответ найден. При таком подходе к нахождению решения суммарный вес связей между словами-стимулами и словом-решением должен быть тем больше, чем проще тройка (меньше время решения).

Рис. 2 Диаграмма рассеяния для оценки сложности и

Как видно из графика (Рис. 2) сложность тройки никак не коррелирует ( = 0,00007) с суммарным весом тройки на сети. Значит такое предположение неверно, но может есть связь между максимальной связью между стимулом и ответом в рамках тройки?

Рис. 3 Диаграмма рассеяния для оценки сложности и

Но и в данном случае мы не наблюдаем зависимости ( = 0,0082) (Рис. 3), оно и не удивительно, ведь эти две величины и положительно коррелированы ( = 0,984).

Следовательно, механизм нахождения общей ассоциации устроен намного сложнее.

5. Гипотеза №2: линейное распространение в несколько шагов

Вероятнее всего испытуемые не просто ищут ассоциации к каждому слову триады, а составляют целые ассоциативные цепочки длины не более чем 1, 2 и бесконечность соответственно, т.е. каждая новая ассоциация порождает следующую. Первое слово, которое содержится в каждой из таких цепочек, стает ответом на тройку. Чтобы учесть все возможные варианты цепочек, рассчитаем матрицу :

где - матрица смежности сети «Карта слов»

Также вычислим все статистики по аналогии с матрицей . В данном случае тоже должно происходить сложение эффектов, т.е. чем больше суммарный вес in-вес для слова-ответа , тем проще для решения будет тройка.

В ходе вычислений выяснилось, что , а значит мы не можем найти обратную матрицу, в связи с этим рассмотрим наибольшую сильно связную компоненту сети для проверки гипотезы. В состав данной компоненты входит 17 троек Медника.

Рис. 4 Диаграмма рассеяния для оценки сложности и

В данном случае наблюдается очень слабая отрицательная корреляция () между оценкой сложности триады и суммарным весом по матрице (Рис. 4). Это довольно необычный результат, который может указывать на то, что линейность не совсем применима к процессу нахождения общей ассоциации, либо нам не достает данных для достоверных результатов.

Поскольку и в данном случае и положительно коррелированы (= 0,98), наблюдаем аналогичную ситуацию (Рис. 5) с коэффициентом корреляции для

Рис. 5 Диаграмма рассеяния для оценки сложности и

Скорее всего причина отсутствия прямой линейной зависимости (в 1 и множество шагов) между стимулами и откликом кроется в том, что авторы, составлявшие данные тесты Медника, делали упор на поиск ассоциаций через общие фразеологизмы. Например, чуть ли не самая сильная из имеющихся в этих словах ассоциация - это глаз лоб (1,204), но для испытуемых вероятнее всего она связана просто с анатомией, а "глаза на лоб полезли" дает очень незначительный вклад в данную связь. Поэтому получается, что поиск ассоциаций специального вида (как в тестах Медника) и поиск ассоциаций вообще (Карта слов) - не одно и то же.

6. Дополнение к линейному распространению

Помимо всего прочего отмечена значительная отрицательная корреляция () между сложностью тройки и весом ассоциаций от слова-ответа к словам-стимулам (Рис. 6), чего мы не видели на английской сети [6]. Это может означать, что испытуемые находят слово-ответ, но не распознают его как решение в случаях, когда ассоциации от ответа к стимулам слишком слабые.

Рис. 6 Диаграмма рассеяния для оценки сложности и

Чем больше слово-ответ ассоциируется со словами триады, тем проще решить тройку. Довольно интересно, почему линейный принцип не работает в одну и работает в другую сторону. Возможно это связано с тем, что слова тройки могут взаимодействовать между собой намного сложнее, создавать некоторую синергию.

Что касается многошаговой линейной гипотезы, здесь наблюдается хоть и слабая, но положительная зависимость между оценкой сложности и (Рис. 7) со значением коэффициента корреляции 0,316. К сожалению, значимым такое наблюдение мы считать не можем.

Рис. 7 Диаграмма рассеяния для оценки сложности и

7. Гипотеза №3: нелинейное распространение

Как ведет себя сложность четверок при превращении их в тройки разными способами. С этой точки зрения все четверки можно разделить на 4 группы, две первые довольно скучные, две следующие - явно гораздо более интересные (Табл. 2).

Табл. 2

Классификация троек Медника

слово_1

слово_2

слово_3

слово_4

ответ

тип

1

ад

друг

порочный

ходить

круг

ровная

2

часы

банк

сыр

шоколад

швейцарский

ровная

3

жесткость

вопрос

бес

Адам

ребро

3:1

4

алмаз

говорить

лоб

край

глаз

2:2

5

ком

первый

голова

дождь

снег

2:2

6

крепкий

Иван

давать

гонять

чай

2:2

7

хлеб

живой

глядеть

гусь

вода

ровная

8

дамский

облизать

погрозить

мальчик

палец

ровная

9

лебединый

петля

сесть

дать

шея

3:1

10

собираться

течение

задний

древо

мысль

2:2

11

мотать

дуть

сам

шевелить

усы

1:3

12

предавать

игра

меч

дым

огонь

1:3

13

ум

камень

чистый

нож

сердце

ровная

14

капля

колено

открытый

погода

море

3:1

15

слоновый

кожа

лечь

мозг

кость

1:3

16

полный

конь

событие

пустить

ход

3:1

17

ученый

мешок

хвост

сапоги

кот

ровная

18

седина

синий

отпустить

анекдот

борода

ровная

19

пила

красный

мясо

лед

рыба

2:2

20

висячий

семь

рот

посадить

замок

1:3

21

съесть

сено

зарыть

вешать

собака

3:1

22

слух

сон

русский

переводить

дух

1:3

23

танец

стих

дом

медведь

белый

ровная

24

шляпа

техника

табак

грешный

дело

1:3

1. Ровные четверки: все четыре соответствующие тройки имеют близкую сложность (разница между самым сложным и самым простым вариантом не более, чем в 2-2,5 раза). Это в основном простые тройки типа {дамский, облизать, погрозить, мальчик} пальчик или {ученый, мешок, хвост, сапоги} кот.

2. Четверки с явным словом-лидером (я предлагаю назвать их четверками типа 1:3): если одно из четырех слов есть в варианте, то вариант простой, если этого слова нет - вариант сложный. Например, в четверке {мотать, дуть, сам, шевелить} усы таким явным лидером является слово "мотать": вариант {дуть, сам, шевелить} оказывается примерно в 5 раз сложнее, чем все три варианта, содержащие слово "мотать". Аналогичная ситуация, например, в тройке {шляпа, техника, табак, грешный} дело, где варианты, содержащие слово "шляпа", оказываются в 3-7 раз проще, чем вариант {техника, табак, грешный}.

3. Третий, более интересно устроенный вариант - это тройки типа 3:1, в которых один из вариантов оказывается намного проще остальных. Такое ощущение, что в этих четверках есть "блокирующее слово", наличие которого в выдаче делает тройку более сложной. Как правило, этот эффект выражен слабее, чем в тройках типа 1:3, так что нельзя исключить того, что мы имеем дело с экспериментальным шумом. Ярче всего ситуация видна для четверки {дать, сесть, лебединый, петля} шея, где все варианты со словом "дать" оказываются как минимум в 2,5 раза сложнее, чем вариант {сесть, лебединый, петля}. Возможно, дело в том, что слово "дать", будучи одним из самых употребительных глаголов, порождает у испытуемых такой фейерверк разнородных ассоциаций, что он мешают решению.

4. Наконец, пожалуй, самый интересный класс - это тройки типа 2:2, т.е. тройки, которые оказываются относительно простыми тогда и только тогда, когда в выдаче есть какие-то два из четырех слов. Например, в четверке {первый, ком, дождь, голова} снег варианты, содержащие слова "первый" и "ком", т.е. {первый, ком, голова} и {первый, ком, дождь}) почти не отличаются по сложности, и оба они в 5-9 раз проще, чем остальные два варианта ({первый, голова, дождь} и {ком, голова, дождь}. Другие варианты, в которых происходит что-то похожее:

{алмаз, лоб, край, говорить} глаз ("важные" слова - алмаз и говорить)

{крепкий, Иван, гонять, давать} чай ("важные" слова - крепкий и Иван)

{собираться, течение, задний, древо} мысль ("важные" слова - собираться и течение)

{пила, красный, мясо, лед} рыба ("важные" слова - пила и красный)

Отмечу, однако, что во всех этих четырех четверках эффект несколько слабее, при этом все эти четыре тройки - довольно сложные, так что статистическая достоверность этого наблюдения пока довольно низкая.

Поведение ровных четверок и четверок типа 1:3 согласуется с гипотезой (теорией) линейного распространения, в таком случае слова между собой никак не взаимодействуют, а их эффекты просто складываются. Но, если я правильно понимаю, в мире, работающем по этим теориям, не могут существовать четверки типа 3:1 или 2:2.

При этом поведение четверок типа 3:1, кажется, можно объяснить относительно малой кровью, если предположить, что высокочастотные слова типа "дать" притягивают внимание испытуемых больше, чем более редкие слова. По сути, тут опять можно обойтись без содержательного взаимодействия между словами-стимулами, нужно просто на этапе "испытуемый наугад выбирает одно слово" добавить какие-то дополнительные веса, описывающие этот выбор. Тогда слово с большим весом и "плохими" с точки зрения решения ассоциациями будет работать блокирующим.

Наконец, тройки типа 2:2 явно устроены более сложно: в них, в отличие от всех остальных, имеется какая-то синергия между словами: для решения недостаточно только слова А или слова В, нужно, чтобы в выдачу они попали оба одновременно. Это явление можно добавить в модель только через какую-то нелинейность. Что-нибудь вроде того, что испытуемый обследует все возможные пары слов из тройки и ищет общие ассоциации к парам (т.е. слова, вес ассоциаций которых с каждым из двух из них выше некоторого порогового) и добавляет это слово к ядру поиска.

8. Вывод

В данной работе были рассмотрены результаты русскоязычного тестирования Медника, полученные в ИПИ РАН в группе профессора А. Поддъякова. Данные прошли всю необходимую предобработку с помощью языка программирования Python. Была предложена оценка сложности тестов Медника. Посредством Excel были вычислены оценка сложности троек и сопутствующие характеристики.

Затем были выдвинуты и проверены предположения о взаимосвязи сложности троек Медника с их топологией на семантической сети. Для этого были рассчитаны такие характеристики, как , , и . При проверке гипотез было отмечено следующее:

1. То, как сильно ассоциативно связаны слова-стимулы со словом-ответом, никак не влияет на скорость решения (сложность) тройки.

2. При этом ассоциативная связь ответа со стимулами упрощает тройку для решения: чем больше ответ ассоциируется со словами-стимулами, тем проще тройка.

3. Слова в тройке взаимодействуют между собой сложнее, чем линейно, когда эффекты стимулов просто складываются. Были выделены 4 сценария таких взаимодействий.

Такое исследование может иметь продолжение, например, можно опросить больше участников и проверить гипотезы о поле и возрасте испытуемых или же сравнить результаты тестирования еще и с другими семантическими сетями.

Литература

1. Mednick S.A. The associative basis of the creative process// Psychological Review. 1962. 69, 220-232

2. Mednick S.A. Remote Associates Test// Journal of Creative Behavior. 1968. 2, 213-214

3. Bowden E. M., Jung-Beeman M. Normative data for 144 compound remote associate problems// Behavior Research Methods, Instruments, & Computers. 2003. 35 (4), 634-639

4. https://wordnet.princeton.edu

5. Newman M. E. J. Networks: an introduction. Oxford University Press 2010

6. Зверева М.В. Структура и свойства семантических сетей// База МГУ. 2019

7. Nelson D.L., Mcevoy C.L., Schreiber T.A. The University of South Florida free association, rhyme, and word fragment norms// Behavior Research Methods, Instruments, & Computers. 2004. 36 (3), 402-407

Приложение

Табл. 1

Характеристики троек Медника

Attribute1

Attribute2

Attribute3

Answer

Solve Ratio

Av.Inv.Time

Diff.Est.

1

ад

друг

порочный

круг

0,941

4,116

3,874

ад

ходить

друг

круг

0,588

4,512

2,654

ад

ходить

порочный

круг

0,647

7,680

4,969

ходить

друг

порочный

круг

0,941

7,431

6,994

2

часы

банк

сыр

швейцарский

0,412

5,308

2,186

часы

банк

шоколад

швейцарский

0,412

2,795

1,151

часы

сыр

шоколад

швейцарский

0,471

5,147

2,422

банк

сыр

шоколад

швейцарский

0,647

7,566

4,896

3

вопрос

бес

Адам

ребро

0,176

1,508

0,266

жесткость

бес

Адам

ребро

0,294

1,286

0,378

жесткость

вопрос

Адам

ребро

0,235

0,603

0,142

жесткость

вопрос

бес

ребро

0,412

2,128

0,876

4

говорить

алмаз

край

глаз

0,176

0,681

0,120

лоб

алмаз

край

глаз

0,059

0,179

0,011

лоб

говорить

алмаз

глаз

0,294

1,414

0,416

лоб

говорить

край

-

0,000

5

голова

первый

ком

снег

0,882

1,954

1,724

дождь

голова

ком

снег

0,235

0,281

0,066

дождь

голова

первый

снег

0,118

0,167

0,020

дождь

первый

ком

снег

0,647

2,092

1,354

6

гонять

Иван

давать

чай

0,118

0,292

0,034

гонять

крепкий

Иван

чай

0,235

1,380

0,325

гонять

крепкий

давать

чай

0,176

0,512

0,090

крепкий

Иван

давать

чай

0,471

2,067

0,973

7

хлеб

живой

глядеть

вода

0,235

0,513

0,121

гусь

живой

глядеть

вода

0,235

1,541

0,363

гусь

хлеб

глядеть

вода

0,353

1,219

0,430

гусь

хлеб

живой

вода

0,176

1,502

0,265

8

дамский

облизать

погрозить

палец

0,882

6,452

5,693

мальчик

дамский

облизать

пальчик

0,824

9,186

7,565

мальчик

дамский

погрозить

пальчик

0,941

7,753

7,297

мальчик

облизать

погрозить

пальчик

0,824

5,918

4,874

9

дать

петля

лебединый

шея

0,176

0,442

0,078

дать

сесть

лебединый

шея

0,059

0,461

0,027

дать

сесть

петля

шея

0,059

0,428

0,025

сесть

петля

лебединый

шея

0,353

1,167

0,412

10

древо

собираться

течение

мысль

0,176

0,632

0,111

задний

древо

собираться

мысль

0,118

0,118

0,014

задний

древо

течение

мысль

0,059

0,120

0,007

задний

собираться

течение

мысль

0,176

1,075

0,190

11

дуть

мотать

сам

ус

0,765

6,928

5,298

дуть

мотать

шевелить

ус

0,706

8,188

5,780

дуть

сам

шевелить

усы

0,294

0,925

0,272

мотать

сам

шевелить

ус

0,882

9,519

8,399

12

дым

игра

меч

огонь

0,353

0,742

0,262

дым

игра

предавать

огонь

0,176

0,417

0,074

дым

меч

предавать

огонь

0,235

0,565

0,133

игра

меч

предавать

-

0,000

13

камень

чистый

нож

сердце

0,118

0,089

0,010

камень

чистый

ум

сердце

0,059

0,083

0,005

камень

нож

ум

-

0,000

чистый

нож

ум

-

0,000

14

капля

открытый

погода

море

0,235

0,964

0,227

колено

капля

открытый

море

0,353

0,700

0,247

колено

капля

погода

море

0,412

1,420

0,585

колено

открытый

погода

море

0,059

0,222

0,013

15

кожа

лечь

мозг

кость

0,235

0,429

0,101

кожа

слоновый

лечь

кость

0,412

1,928

0,794

кожа

слоновый

мозг

кость

0,471

1,271

0,598

слоновый

лечь

мозг

кость

0,412

1,223

0,503

16

конь

пустить

событие

ход

0,176

0,493

0,087

полный

конь

пустить

ход

0,059

0,056

0,003

полный

конь

событие

ход

0,176

1,815

0,320

полный

пустить

событие

-

0,000

17

мешок

хвост

сапоги

кот

0,588

3,633

2,137

ученый

мешок

сапоги

кот

0,647

7,192

4,653

ученый

мешок

хвост

кот

0,706

5,543

3,913

ученый

хвост

сапоги

кот

0,765

4,230

3,235

18

отпустить

анекдот

седина

борода

0,706

4,707

3,323

синий

анекдот

седина

борода

0,588

3,890

2,288

синий

отпустить

анекдот

борода

0,412

3,129

1,288

синий

отпустить

седина

борода

0,824

8,216

6,766

19

пила

красный

лед

рыба

0,353

1,561

0,551

пила

мясо

красный

рыба

0,412

2,382

0,981

пила

мясо

лед

рыба

0,235

0,426

0,100

мясо

красный

лед

-

0,000

20

рот

висячий

посадить

замок

0,353

2,235

0,789

семь

висячий

посадить

замок

0,176

1,199

0,212

семь

рот

висячий

замок

0,353

1,810

0,639

семь

рот

посадить

замок

0,118

0,343

0,040

21

сено

зарыть

вешать

собака

0,176

1,506

0,266

сено

съесть

вешать

собака

0,412

1,820

0,750

сено

съесть

зарыть

собака

0,647

3,833

2,480

съесть

зарыть

вешать

собака

0,235

1,277

0,300

22

слух

русский

переводить

дух

0,118

0,180

0,021

слух

сон

русский

дух

0,235

0,489

0,115

сон

русский

переводить

дух

0,118

0,535

0,063

слух

сон

переводить

-

0,000

23

стих

медведь

дом

белый

0,471

2,015

0,948

танец

медведь

дом

белый

0,235

1,848

0,435

танец

стих

дом

белый

0,471

3,268

1,538

танец

стих

медведь

белый

0,471

3,031

1,426

24

табак

техника

грешный

дело

0,118

0,176

0,021

шляпа

табак

грешный

дело

0,176

1,100

0,194

шляпа

табак

техника

дело

0,412

2,252

0,927

шляпа

техника

грешный

дело

0,353

1,789

0,631

# Фрагменты кода на Python

# Поиск троек на сети

# Вычисление характеристик троек на сети (матрица А)

# Вычисление характеристик троек на сети (матрица В)

#Корреляция и графики

Размещено на Allbest.ru


Подобные документы

  • Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.

    контрольная работа [1,4 M], добавлен 28.01.2011

  • Выбор цели тестирования, составление структурно-логической схемы проверяемого учебного материала и тестовых заданий. Конструирование базы заданий, требования к оформлению, составление эталона и апробация тестов. Материалы тестов целевого назначения.

    курсовая работа [86,3 K], добавлен 19.07.2011

  • Разработка программного обеспечения, предназначенного для предоставления трех способов прохождения тестов для студентов. Построение модели потоков данных, физической базы данных. Выбор языка программирования. Условия эксплуатации, требования к надежности.

    дипломная работа [2,7 M], добавлен 18.04.2014

  • Описание компиляторов языка С/С++: MinGW, Borland Builder, Watcom, Intel C++, Visual. Сравнение характеристик выполнения программ на примере простого кода. Проведение тестов для компиляторов, оценка скорости выполнения и компилирования, их опций.

    курсовая работа [1,6 M], добавлен 05.10.2012

  • Понятие и характеристика открытой системы образовательных тестов (ОСОТ). Ее преимущества и недостатки, их сущность. Алгоритм работы с системой, детальное описание процесса. Установка системы на сервер и ее использование. Изложение алгоритма решения.

    доклад [28,1 K], добавлен 25.02.2009

  • Выбор технологии, языка и среды программирования. Анализ процесса обработки информации и выбор структур данных для ее хранения, разработка основных алгоритмов. Проектирование интерфейса пользователя. Выбор стратегии тестирования и разработка тестов.

    курсовая работа [332,3 K], добавлен 09.12.2014

  • Разработка программы автоматизации процесса проверки знаний учащихся. Использование языка программирования Borland Delphi 7.0, его свойства, компоненты для работы со строками. Создание обучающих тестов на знание лексики и грамматики английского языка.

    курсовая работа [521,0 K], добавлен 06.03.2016

  • Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.

    дипломная работа [2,6 M], добавлен 23.09.2013

  • Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.

    дипломная работа [5,4 M], добавлен 08.02.2016

  • Проблема выбора между необходимым уровнем защиты и эффективностью работы в сети. Механизмы обеспечения защиты информации в сетях: криптография, электронная подпись, аутентификация, защита сетей. Требования к современным средствам защиты информации.

    курсовая работа [32,1 K], добавлен 12.01.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.