Главная Коллекция "Otherreferats" Программирование, компьютеры и кибернетика Распространение сигналов на семантических сетях

Распространение сигналов на семантических сетях

Исследование распространения сигналов на семантической сети русского языка на примере решения психологических тестов Медника. Подготовка к использованию в исследовании сети свободных ассоциаций русского языка. Возможные механизмы решения тестов Медника.

Рубрика	Программирование, компьютеры и кибернетика
Вид	дипломная работа
Язык	русский
Дата добавления	15.09.2020
Размер файла	603,2 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Московский институт электроники и математики им. А.Н. Тихонова

Выпускная квалификационная работа - магистерская диссертация

по направлению 01.04.02 Прикладная математика и информатика

Распространение сигналов на семантических сетях

Студент Е.С. Патрушева

Научный руководитель

к. ф.-м. н., доцент М.В. Тамм

Москва 2020

ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Московский институт электроники и математики им. А.Н. Тихонова

ЗАДАНИЕ на выполнение магистерской диссертации

студенту группы ММКТ181 Патрушевой Екатерине Сергеевне

1. Тема работы

Распространение сигналов на семантических сетях

2. Цель работы

Исследовать распространение сигналов на семантической сети русского языка на примере решения психологических тестов Медника

3. Формулировка задания

? Получить и подготовить данные о сложности русскоязычных тестов Медника

? Совместно с другими студентами из группы получить и подготовить к использованию в исследовании сеть свободных ассоциаций русского языка

? Сформулировать ряд гипотез о возможных механизмах решения тестов Медника (прямые ассоциации, цепочки ассоциаций и т.д.) и об индуцируемой этими механизмами связи сложности тестов Медника с взаимным расположением слов-символов и слова-отклика на сети ассоциаций.

? Проверить предложенные гипотезы.

Проект ВКР должен быть предоставлен студентом в срок до «15» декабря 2019 г.

Научный руководитель ВКР «13» декабря 2019 г. ______________ М.В. Тамм тест медник сигнал семантический

Первый вариант ВКР предоставлен студентом в срок до «15» марта 2020 г.

Научный руководитель ВКР «15» марта 2020 г. ______________ М.В. Тамм

Итоговый вариант ВКР предоставлен студентом в срок до «12» мая 2020 г.

Научный руководитель ВКР «12» мая 2020 г. ______________ М.В. Тамм

Задание выдано студенту «20» ноября 2019 г. ______________ М.В. Тамм

Задание принято к исполнению студентом «20» ноября 2019 г. ______________ Е.С. Патрушева

Аннотация

В данной работе рассмотрены результаты тестирования Медника на русском языке. Предложена оценка сложности тестов. Найдена взаимосвязь между сложностью троек и их расположением на семантической сети.

Annotation

In this research paper I consider results of Remote Associates Test in Russian language. I have calculated difficulty estimate for each Mednick's triads. In addition, correlation between complexity of triples and their location on the semantic network has been found.

Оглавление

1. Введение

2. Подготовка данных

3. Карта слов

4. Гипотеза №1: линейное распространение в 1 шаг

5. Гипотеза №2: линейное распространение в несколько шагов

6. Дополнение к линейному распространению

7. Гипотеза №3: нелинейное распространение

8. Вывод

Литература

Приложение

1. Введение

В психологии широко известен тест вербальной креативности Медника или, как его еще называют, тест отдаленных ассоциаций (RAT) [1-2], придуманный Сарноффом Андреем Медником в 1962 г. Испытуемому дается словесная тройка, например, {дым, игра, меч}, для которой необходимо найти слово-решение (общую устойчивую ассоциацию) {огонь}, которое образовывало бы некоторое словосочетание с каждым из слов триады. При этом образование таких словосочетаний может происходить единообразно, а может и абсолютно по-разному (тестирующий может налагать на это ограничения). Высокая скорость нахождения общей ассоциации и ее уникальность свидетельствуют об успешном прохождении тестирования, т.е. о высокой степени креативности мышления. Тройки подбираются таким образом, чтобы все испытуемые были в равных условиях, т.е. нет привязки к какой-либо узкой области. Многие психологи пытаются привнести что-то свое в этот тест, начиная с простого ограничения по времени и заканчивая снятием биологических показателей [3]. Все это делается для того, чтобы понять, как устроено человеческое мышление. Более сложные опыты помогают выявить более тонкие закономерности.

В свою очередь, до сих пор до конца не понятны механизмы нахождения общей ассоциации: влияет ли на это каждое из слов тройки или же какому-то из слов отдается предпочтение и идет перебор его ассоциаций. Если испытуемый выделяет какое-то из слов триады, то каким из методов он приходит к ответу, берет первую ассоциацию к данному слову или все же пытается строить ассоциативные цепочки? Эти и многие другие гипотезы я постараюсь проверить в своей работе.

Кроме того, не вполне понятно, чем определяется сложность тестов Медника. Целью нашего исследования является поиск связи между сложностью заданий в эксперименте Медника и взаимным расположением слов-стимулов и слова-ответа на сети свободных ассоциаций. Мы располагали сырыми данными о структуре сети свободных ассоциаций русского языка и о результатах психологических экспериментов по решению тестов Медника. Доступные нам экспериментальные данные получены в ИПИ РАН в группе профессора А. Поддъякова. О каждом испытуемом известны пол, возраст, степень и профиль образования. Кроме того, постановка эксперимента в этом случае имела одну дополнительную особенность: для каждого слова-ответа существовало не три, а четыре возможных стимула, так что имелась возможность выбрать три из них четырьмя разными способами. Таким образом, можно сказать, что каждая тройка существовала в этом эксперименте в 4 разновидностях, испытуемые получали одну из них случайным образом. Наличие такого варьируемого состава троек, как предполагается, может позволить более детально понять механизм поиска общей ассоциации.

В данной работе будут рассмотрены результаты тестирования Медника на русском языке, полученные в ИПИ РАН. Результаты тестов пройдут всю необходимую обработку. Для каждой из троек будут рассчитаны количественные характеристики, которые помогут оценить сложность тройки. Помимо всего прочего будет проверено несколько предположений о зависимости сложности тройки от ее положения на семантической сети.

2. Подготовка данных

Мною были рассмотрены данные о решении тестов Медника 68 респондентами разных возрастов мужского и женского пола, каждый из которых получил 24 тройки-стимула. Поскольку каждая тройка существовала в 4 различных вариантах (см. введение), каждый вариант теста был предложен 17 испытуемым. Для каждого испытуемого и каждой тройки были известны время решения в миллисекундах, ответ и его правильность (верно/неверно/нет ответа).

Перед началом исследования полученные данные прошли чистку и предварительную обработку, а также были сгруппированы по тройкам при помощи языка программирования Python и средств Excel (см. Приложение).

Для дальнейшего анализа необходимо каким-то образом количественно описать сложность каждого теста. В качестве возможных оценок сложности теста были рассмотрены такие характеристики, как доля решивших, среднее обратное время решения, а также более общее, зависящее от параметра , среднее ( - время решения тройки в минутах), которое при переходит в среднее обратное время решения, а при - в среднюю долю решивших. Важно отметить, что разброс времен решения для одной и той же тройки очень велик. Была поставлена задача выяснить, существует ли оптимальное значение при котором относительная дисперсия минимальна, т.е. характеристика сложности тройки лучше всего определена. С уменьшением параметра наблюдалось уменьшение дисперсии (от 0,333 при до 0,076 при ), при этом предельное значение так и не было найдено. Таким образом оказалось, что самая устойчивая характеристика сложности тройки - это доля решивших.

Тем не менее, представляется, что обратное время решения, хоть и является сильно флуктуирующей характеристикой, все же содержит важную дополнительную информацию о сложности тройки. В связи с этим в дальнейшем предполагается использовать в качестве основной характеристики сложности тройки произведение средней доли решивших и среднего обратного времени решения (см. Приложение: Табл. 1). Ниже приведен график зависимости этих двух величин (Рис. 1), коэффициент корреляции составил 0,939

Рис. 1 Диаграмма рассеяния для доли правильно решивших и среднего обратного времени решения

Чем больше будет значение такой характеристики, тем проще тройка для решения испытуемым.

3. Карта слов

«Карта слов» - это масштабный интернет-проект по созданию базы данных различного рода семантических связей между словами и выражениями в русском языке (пример в английском языке [4]). Непрерывный сбор новых данных происходит в интерактивном формате при помощи сайта проекта kartaslov.ru. Пополнение сети ассоциаций [5] происходит следующим образом: в форме игры посетителю сайта предлагается ввести все возникшие за отведённое время ассоциации, так называемые отклики, на заданное слово-стимул. Образовавшимся связям присваивается вес, обратно пропорциональный их числу, веса одинаковых связей, полученных от разных участников, суммируются.

Данный подход к сбору данных имеет определенные недостатки. Во-первых, веса в такой сети распределены очень неравномерно, поскольку через каждый стимул проходит разное число человек, к тому же каждый испытуемый никак не ограничен в количестве ассоциаций, найденных для каждого слова. Во-вторых, автоматический сбор данных не позволяет наложить ограничения на формат откликов, гарантирующие их единообразие, поэтому отклики в ассоциативной сети «Карта слов» могут принимать различные словоформы (разные число, падеж, род), а в отдельных случаях являются целыми словосочетаниями. При этом в качестве стимулов используются лишь основные формы слов. Это различие между форматами слов-стимулов и слов-ответов необходимо тем или иным образом учесть для того, чтобы сделать сеть пригодной для дальнейшего анализа методами теории сложных сетей.

Мы приняли решение рассматривать в качестве элементарного объекта, узла сети ассоциаций, не словоформу, а слово в целом, во всем многообразии его форм. В связи с этим встала задача о «склейке» различных словоформ в массиве экспериментальных данных. Моя коллега, Софья Толстоухова, произвела всю необходимую предобработку данных посредством таких библиотек Python, как NetworkX и Pymorphy, пытаясь устранить уже упомянутые недостатки метода сбора данных. Была определена доля вершин (стимул/отклик), выраженных словосочетаниями - выяснилось, что таких вершин в сети всего 4%, поэтому было принято решение пренебречь ими и исключить их из общего массива данных. Вследствие этого плотность сети увеличилась приблизительно в два раза, хотя по-прежнему осталась невелика: против первоначальных . Затем слова были приведены в нормальную форму, а совпадающие вершины были «склеены» (плотность сети возросла до ). К тому же были произведена работа с петлями и мультиребрами, которые образовались вследствие языковых преобразований. В итоговой сети 29489 вершин и 582149 ребер.

Я выражаю огромную благодарность Софье за подготовку сети, в дальнейшем она будет использоваться для поиска взаимосвязи между сложностью троек Медника и их расположением на семантической сети.

Для характеризации тройки на сети были взяты следующие статистики:

a.	-	максимальный in-вес для вершины (общей ассоциации)
b.	-	суммарный in-вес для вершины
c.	-	максимальный out-вес для вершины (общей ассоциации)
d.	-	суммарный out-вес для вершины

где - вес связи между вершинами и , элемент матрицы смежности для сети «Карта слов»

В сети было найдено 62 тройки, при этом 22 их них не имеют смежных вершин. Для данных троек были рассчитаны характеристики , , и , некоторые из них оказались нулевыми. Самое большое значение = 0,0878 было у тройки {дым, игра, меч} огонь, а самое маленькое (0) {вопрос, бес, Адам} ребро. В свою очередь максимальным значением = 0,1175 обладает тройка {мальчик, дамский, облизать} пальчик, а наименьшим (0) {древо, собираться, течение} мысль.

4. Гипотеза №1: линейное распространение в 1 шаг

Давайте попытаемся разобраться в том, как происходит процесс нахождения общей ассоциации. Логично предположить, что испытуемый рассматривает каждое слово тройки по отдельности, пытаясь подобрать к нему как можно больше ассоциаций. Когда находится некоторое слово, которое ассоциируется с каждым из 3х слов, можно считать, что ответ найден. При таком подходе к нахождению решения суммарный вес связей между словами-стимулами и словом-решением должен быть тем больше, чем проще тройка (меньше время решения).

Рис. 2 Диаграмма рассеяния для оценки сложности и

Как видно из графика (Рис. 2) сложность тройки никак не коррелирует ( = 0,00007) с суммарным весом тройки на сети. Значит такое предположение неверно, но может есть связь между максимальной связью между стимулом и ответом в рамках тройки?

Рис. 3 Диаграмма рассеяния для оценки сложности и

Но и в данном случае мы не наблюдаем зависимости ( = 0,0082) (Рис. 3), оно и не удивительно, ведь эти две величины и положительно коррелированы ( = 0,984).

Следовательно, механизм нахождения общей ассоциации устроен намного сложнее.

5. Гипотеза №2: линейное распространение в несколько шагов

Вероятнее всего испытуемые не просто ищут ассоциации к каждому слову триады, а составляют целые ассоциативные цепочки длины не более чем 1, 2 и бесконечность соответственно, т.е. каждая новая ассоциация порождает следующую. Первое слово, которое содержится в каждой из таких цепочек, стает ответом на тройку. Чтобы учесть все возможные варианты цепочек, рассчитаем матрицу :

где - матрица смежности сети «Карта слов»

Также вычислим все статистики по аналогии с матрицей . В данном случае тоже должно происходить сложение эффектов, т.е. чем больше суммарный вес in-вес для слова-ответа , тем проще для решения будет тройка.

В ходе вычислений выяснилось, что , а значит мы не можем найти обратную матрицу, в связи с этим рассмотрим наибольшую сильно связную компоненту сети для проверки гипотезы. В состав данной компоненты входит 17 троек Медника.

Рис. 4 Диаграмма рассеяния для оценки сложности и

В данном случае наблюдается очень слабая отрицательная корреляция () между оценкой сложности триады и суммарным весом по матрице (Рис. 4). Это довольно необычный результат, который может указывать на то, что линейность не совсем применима к процессу нахождения общей ассоциации, либо нам не достает данных для достоверных результатов.

Поскольку и в данном случае и положительно коррелированы (= 0,98), наблюдаем аналогичную ситуацию (Рис. 5) с коэффициентом корреляции для

Рис. 5 Диаграмма рассеяния для оценки сложности и

Скорее всего причина отсутствия прямой линейной зависимости (в 1 и множество шагов) между стимулами и откликом кроется в том, что авторы, составлявшие данные тесты Медника, делали упор на поиск ассоциаций через общие фразеологизмы. Например, чуть ли не самая сильная из имеющихся в этих словах ассоциация - это глаз лоб (1,204), но для испытуемых вероятнее всего она связана просто с анатомией, а "глаза на лоб полезли" дает очень незначительный вклад в данную связь. Поэтому получается, что поиск ассоциаций специального вида (как в тестах Медника) и поиск ассоциаций вообще (Карта слов) - не одно и то же.

6. Дополнение к линейному распространению

Помимо всего прочего отмечена значительная отрицательная корреляция () между сложностью тройки и весом ассоциаций от слова-ответа к словам-стимулам (Рис. 6), чего мы не видели на английской сети [6]. Это может означать, что испытуемые находят слово-ответ, но не распознают его как решение в случаях, когда ассоциации от ответа к стимулам слишком слабые.

Рис. 6 Диаграмма рассеяния для оценки сложности и

Чем больше слово-ответ ассоциируется со словами триады, тем проще решить тройку. Довольно интересно, почему линейный принцип не работает в одну и работает в другую сторону. Возможно это связано с тем, что слова тройки могут взаимодействовать между собой намного сложнее, создавать некоторую синергию.

Что касается многошаговой линейной гипотезы, здесь наблюдается хоть и слабая, но положительная зависимость между оценкой сложности и (Рис. 7) со значением коэффициента корреляции 0,316. К сожалению, значимым такое наблюдение мы считать не можем.

Рис. 7 Диаграмма рассеяния для оценки сложности и

7. Гипотеза №3: нелинейное распространение

Как ведет себя сложность четверок при превращении их в тройки разными способами. С этой точки зрения все четверки можно разделить на 4 группы, две первые довольно скучные, две следующие - явно гораздо более интересные (Табл. 2).

Табл. 2

Классификация троек Медника

	слово_1	слово_2	слово_3	слово_4	ответ	тип
1	ад	друг	порочный	ходить	круг	ровная
2	часы	банк	сыр	шоколад	швейцарский	ровная
3	жесткость	вопрос	бес	Адам	ребро	3:1
4	алмаз	говорить	лоб	край	глаз	2:2
5	ком	первый	голова	дождь	снег	2:2
6	крепкий	Иван	давать	гонять	чай	2:2
7	хлеб	живой	глядеть	гусь	вода	ровная
8	дамский	облизать	погрозить	мальчик	палец	ровная
9	лебединый	петля	сесть	дать	шея	3:1
10	собираться	течение	задний	древо	мысль	2:2
11	мотать	дуть	сам	шевелить	усы	1:3
12	предавать	игра	меч	дым	огонь	1:3
13	ум	камень	чистый	нож	сердце	ровная
14	капля	колено	открытый	погода	море	3:1
15	слоновый	кожа	лечь	мозг	кость	1:3
16	полный	конь	событие	пустить	ход	3:1
17	ученый	мешок	хвост	сапоги	кот	ровная
18	седина	синий	отпустить	анекдот	борода	ровная
19	пила	красный	мясо	лед	рыба	2:2
20	висячий	семь	рот	посадить	замок	1:3
21	съесть	сено	зарыть	вешать	собака	3:1
22	слух	сон	русский	переводить	дух	1:3
23	танец	стих	дом	медведь	белый	ровная
24	шляпа	техника	табак	грешный	дело	1:3

1. Ровные четверки: все четыре соответствующие тройки имеют близкую сложность (разница между самым сложным и самым простым вариантом не более, чем в 2-2,5 раза). Это в основном простые тройки типа {дамский, облизать, погрозить, мальчик} пальчик или {ученый, мешок, хвост, сапоги} кот.

2. Четверки с явным словом-лидером (я предлагаю назвать их четверками типа 1:3): если одно из четырех слов есть в варианте, то вариант простой, если этого слова нет - вариант сложный. Например, в четверке {мотать, дуть, сам, шевелить} усы таким явным лидером является слово "мотать": вариант {дуть, сам, шевелить} оказывается примерно в 5 раз сложнее, чем все три варианта, содержащие слово "мотать". Аналогичная ситуация, например, в тройке {шляпа, техника, табак, грешный} дело, где варианты, содержащие слово "шляпа", оказываются в 3-7 раз проще, чем вариант {техника, табак, грешный}.

3. Третий, более интересно устроенный вариант - это тройки типа 3:1, в которых один из вариантов оказывается намного проще остальных. Такое ощущение, что в этих четверках есть "блокирующее слово", наличие которого в выдаче делает тройку более сложной. Как правило, этот эффект выражен слабее, чем в тройках типа 1:3, так что нельзя исключить того, что мы имеем дело с экспериментальным шумом. Ярче всего ситуация видна для четверки {дать, сесть, лебединый, петля} шея, где все варианты со словом "дать" оказываются как минимум в 2,5 раза сложнее, чем вариант {сесть, лебединый, петля}. Возможно, дело в том, что слово "дать", будучи одним из самых употребительных глаголов, порождает у испытуемых такой фейерверк разнородных ассоциаций, что он мешают решению.

4. Наконец, пожалуй, самый интересный класс - это тройки типа 2:2, т.е. тройки, которые оказываются относительно простыми тогда и только тогда, когда в выдаче есть какие-то два из четырех слов. Например, в четверке {первый, ком, дождь, голова} снег варианты, содержащие слова "первый" и "ком", т.е. {первый, ком, голова} и {первый, ком, дождь}) почти не отличаются по сложности, и оба они в 5-9 раз проще, чем остальные два варианта ({первый, голова, дождь} и {ком, голова, дождь}. Другие варианты, в которых происходит что-то похожее:

{алмаз, лоб, край, говорить} глаз ("важные" слова - алмаз и говорить)

{крепкий, Иван, гонять, давать} чай ("важные" слова - крепкий и Иван)

{собираться, течение, задний, древо} мысль ("важные" слова - собираться и течение)

{пила, красный, мясо, лед} рыба ("важные" слова - пила и красный)

Отмечу, однако, что во всех этих четырех четверках эффект несколько слабее, при этом все эти четыре тройки - довольно сложные, так что статистическая достоверность этого наблюдения пока довольно низкая.

Поведение ровных четверок и четверок типа 1:3 согласуется с гипотезой (теорией) линейного распространения, в таком случае слова между собой никак не взаимодействуют, а их эффекты просто складываются. Но, если я правильно понимаю, в мире, работающем по этим теориям, не могут существовать четверки типа 3:1 или 2:2.

При этом поведение четверок типа 3:1, кажется, можно объяснить относительно малой кровью, если предположить, что высокочастотные слова типа "дать" притягивают внимание испытуемых больше, чем более редкие слова. По сути, тут опять можно обойтись без содержательного взаимодействия между словами-стимулами, нужно просто на этапе "испытуемый наугад выбирает одно слово" добавить какие-то дополнительные веса, описывающие этот выбор. Тогда слово с большим весом и "плохими" с точки зрения решения ассоциациями будет работать блокирующим.

Наконец, тройки типа 2:2 явно устроены более сложно: в них, в отличие от всех остальных, имеется какая-то синергия между словами: для решения недостаточно только слова А или слова В, нужно, чтобы в выдачу они попали оба одновременно. Это явление можно добавить в модель только через какую-то нелинейность. Что-нибудь вроде того, что испытуемый обследует все возможные пары слов из тройки и ищет общие ассоциации к парам (т.е. слова, вес ассоциаций которых с каждым из двух из них выше некоторого порогового) и добавляет это слово к ядру поиска.

8. Вывод

В данной работе были рассмотрены результаты русскоязычного тестирования Медника, полученные в ИПИ РАН в группе профессора А. Поддъякова. Данные прошли всю необходимую предобработку с помощью языка программирования Python. Была предложена оценка сложности тестов Медника. Посредством Excel были вычислены оценка сложности троек и сопутствующие характеристики.

Затем были выдвинуты и проверены предположения о взаимосвязи сложности троек Медника с их топологией на семантической сети. Для этого были рассчитаны такие характеристики, как , , и . При проверке гипотез было отмечено следующее:

1. То, как сильно ассоциативно связаны слова-стимулы со словом-ответом, никак не влияет на скорость решения (сложность) тройки.

2. При этом ассоциативная связь ответа со стимулами упрощает тройку для решения: чем больше ответ ассоциируется со словами-стимулами, тем проще тройка.

3. Слова в тройке взаимодействуют между собой сложнее, чем линейно, когда эффекты стимулов просто складываются. Были выделены 4 сценария таких взаимодействий.

Такое исследование может иметь продолжение, например, можно опросить больше участников и проверить гипотезы о поле и возрасте испытуемых или же сравнить результаты тестирования еще и с другими семантическими сетями.

Литература

1. Mednick S.A. The associative basis of the creative process// Psychological Review. 1962. 69, 220-232

2. Mednick S.A. Remote Associates Test// Journal of Creative Behavior. 1968. 2, 213-214

3. Bowden E. M., Jung-Beeman M. Normative data for 144 compound remote associate problems// Behavior Research Methods, Instruments, & Computers. 2003. 35 (4), 634-639

4. https://wordnet.princeton.edu

5. Newman M. E. J. Networks: an introduction. Oxford University Press 2010

6. Зверева М.В. Структура и свойства семантических сетей// База МГУ. 2019

7. Nelson D.L., Mcevoy C.L., Schreiber T.A. The University of South Florida free association, rhyme, and word fragment norms// Behavior Research Methods, Instruments, & Computers. 2004. 36 (3), 402-407

Приложение

Табл. 1

Характеристики троек Медника

№	Attribute1	Attribute2	Attribute3	Answer	Solve Ratio	Av.Inv.Time	Diff.Est.
1	ад	друг	порочный	круг	0,941	4,116	3,874
	ад	ходить	друг	круг	0,588	4,512	2,654
	ад	ходить	порочный	круг	0,647	7,680	4,969
	ходить	друг	порочный	круг	0,941	7,431	6,994
2	часы	банк	сыр	швейцарский	0,412	5,308	2,186
	часы	банк	шоколад	швейцарский	0,412	2,795	1,151
	часы	сыр	шоколад	швейцарский	0,471	5,147	2,422
	банк	сыр	шоколад	швейцарский	0,647	7,566	4,896
3	вопрос	бес	Адам	ребро	0,176	1,508	0,266
	жесткость	бес	Адам	ребро	0,294	1,286	0,378
	жесткость	вопрос	Адам	ребро	0,235	0,603	0,142
	жесткость	вопрос	бес	ребро	0,412	2,128	0,876
4	говорить	алмаз	край	глаз	0,176	0,681	0,120
	лоб	алмаз	край	глаз	0,059	0,179	0,011
	лоб	говорить	алмаз	глаз	0,294	1,414	0,416
	лоб	говорить	край	-			0,000
5	голова	первый	ком	снег	0,882	1,954	1,724
	дождь	голова	ком	снег	0,235	0,281	0,066
	дождь	голова	первый	снег	0,118	0,167	0,020
	дождь	первый	ком	снег	0,647	2,092	1,354
6	гонять	Иван	давать	чай	0,118	0,292	0,034
	гонять	крепкий	Иван	чай	0,235	1,380	0,325
	гонять	крепкий	давать	чай	0,176	0,512	0,090
	крепкий	Иван	давать	чай	0,471	2,067	0,973
7	хлеб	живой	глядеть	вода	0,235	0,513	0,121
	гусь	живой	глядеть	вода	0,235	1,541	0,363
	гусь	хлеб	глядеть	вода	0,353	1,219	0,430
	гусь	хлеб	живой	вода	0,176	1,502	0,265
8	дамский	облизать	погрозить	палец	0,882	6,452	5,693
	мальчик	дамский	облизать	пальчик	0,824	9,186	7,565
	мальчик	дамский	погрозить	пальчик	0,941	7,753	7,297
	мальчик	облизать	погрозить	пальчик	0,824	5,918	4,874
9	дать	петля	лебединый	шея	0,176	0,442	0,078
	дать	сесть	лебединый	шея	0,059	0,461	0,027
	дать	сесть	петля	шея	0,059	0,428	0,025
	сесть	петля	лебединый	шея	0,353	1,167	0,412
10	древо	собираться	течение	мысль	0,176	0,632	0,111
	задний	древо	собираться	мысль	0,118	0,118	0,014
	задний	древо	течение	мысль	0,059	0,120	0,007
	задний	собираться	течение	мысль	0,176	1,075	0,190
11	дуть	мотать	сам	ус	0,765	6,928	5,298
	дуть	мотать	шевелить	ус	0,706	8,188	5,780
	дуть	сам	шевелить	усы	0,294	0,925	0,272
	мотать	сам	шевелить	ус	0,882	9,519	8,399
12	дым	игра	меч	огонь	0,353	0,742	0,262
	дым	игра	предавать	огонь	0,176	0,417	0,074
	дым	меч	предавать	огонь	0,235	0,565	0,133
	игра	меч	предавать	-			0,000
13	камень	чистый	нож	сердце	0,118	0,089	0,010
	камень	чистый	ум	сердце	0,059	0,083	0,005
	камень	нож	ум	-			0,000
	чистый	нож	ум	-			0,000
14	капля	открытый	погода	море	0,235	0,964	0,227
	колено	капля	открытый	море	0,353	0,700	0,247
	колено	капля	погода	море	0,412	1,420	0,585
	колено	открытый	погода	море	0,059	0,222	0,013
15	кожа	лечь	мозг	кость	0,235	0,429	0,101
	кожа	слоновый	лечь	кость	0,412	1,928	0,794
	кожа	слоновый	мозг	кость	0,471	1,271	0,598
	слоновый	лечь	мозг	кость	0,412	1,223	0,503
16	конь	пустить	событие	ход	0,176	0,493	0,087
	полный	конь	пустить	ход	0,059	0,056	0,003
	полный	конь	событие	ход	0,176	1,815	0,320
	полный	пустить	событие	-			0,000
17	мешок	хвост	сапоги	кот	0,588	3,633	2,137
	ученый	мешок	сапоги	кот	0,647	7,192	4,653
	ученый	мешок	хвост	кот	0,706	5,543	3,913
	ученый	хвост	сапоги	кот	0,765	4,230	3,235
18	отпустить	анекдот	седина	борода	0,706	4,707	3,323
	синий	анекдот	седина	борода	0,588	3,890	2,288
	синий	отпустить	анекдот	борода	0,412	3,129	1,288
	синий	отпустить	седина	борода	0,824	8,216	6,766
19	пила	красный	лед	рыба	0,353	1,561	0,551
	пила	мясо	красный	рыба	0,412	2,382	0,981
	пила	мясо	лед	рыба	0,235	0,426	0,100
	мясо	красный	лед	-			0,000
20	рот	висячий	посадить	замок	0,353	2,235	0,789
	семь	висячий	посадить	замок	0,176	1,199	0,212
	семь	рот	висячий	замок	0,353	1,810	0,639
	семь	рот	посадить	замок	0,118	0,343	0,040
21	сено	зарыть	вешать	собака	0,176	1,506	0,266
	сено	съесть	вешать	собака	0,412	1,820	0,750
	сено	съесть	зарыть	собака	0,647	3,833	2,480
	съесть	зарыть	вешать	собака	0,235	1,277	0,300
22	слух	русский	переводить	дух	0,118	0,180	0,021
	слух	сон	русский	дух	0,235	0,489	0,115
	сон	русский	переводить	дух	0,118	0,535	0,063
	слух	сон	переводить	-			0,000
23	стих	медведь	дом	белый	0,471	2,015	0,948
	танец	медведь	дом	белый	0,235	1,848	0,435
	танец	стих	дом	белый	0,471	3,268	1,538
	танец	стих	медведь	белый	0,471	3,031	1,426
24	табак	техника	грешный	дело	0,118	0,176	0,021
	шляпа	табак	грешный	дело	0,176	1,100	0,194
	шляпа	табак	техника	дело	0,412	2,252	0,927
	шляпа	техника	грешный	дело	0,353	1,789	0,631

# Фрагменты кода на Python

# Поиск троек на сети

# Вычисление характеристик троек на сети (матрица А)

# Вычисление характеристик троек на сети (матрица В)

#Корреляция и графики

Размещено на Allbest.ru

дипломная работа "Распространение сигналов на семантических сетях" скачать

Подобные документы

Самообучающиеся системы
Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.

контрольная работа [1,4 M], добавлен 28.01.2011
Разработка тестов целевого назначения по теме "Адресация в IP-сетях"
Выбор цели тестирования, составление структурно-логической схемы проверяемого учебного материала и тестовых заданий. Конструирование базы заданий, требования к оформлению, составление эталона и апробация тестов. Материалы тестов целевого назначения.

курсовая работа [86,3 K], добавлен 19.07.2011
Разработка программного продукта для прохождения тестов
Разработка программного обеспечения, предназначенного для предоставления трех способов прохождения тестов для студентов. Построение модели потоков данных, физической базы данных. Выбор языка программирования. Условия эксплуатации, требования к надежности.

дипломная работа [2,7 M], добавлен 18.04.2014
Сравнение компиляторов языка С++ для трудных задач
Описание компиляторов языка С/С++: MinGW, Borland Builder, Watcom, Intel C++, Visual. Сравнение характеристик выполнения программ на примере простого кода. Проведение тестов для компиляторов, оценка скорости выполнения и компилирования, их опций.

курсовая работа [1,6 M], добавлен 05.10.2012
Открытая Система Образовательных Тестов
Понятие и характеристика открытой системы образовательных тестов (ОСОТ). Ее преимущества и недостатки, их сущность. Алгоритм работы с системой, детальное описание процесса. Установка системы на сервер и ее использование. Изложение алгоритма решения.

доклад [28,1 K], добавлен 25.02.2009
Разработка специализированного программного модуля для решения указанной задачи
Выбор технологии, языка и среды программирования. Анализ процесса обработки информации и выбор структур данных для ее хранения, разработка основных алгоритмов. Проектирование интерфейса пользователя. Выбор стратегии тестирования и разработка тестов.

курсовая работа [332,3 K], добавлен 09.12.2014
Разработка тестовых заданий по теме "Лексика и грамматика английского языка" на языке программирования Delphi
Разработка программы автоматизации процесса проверки знаний учащихся. Использование языка программирования Borland Delphi 7.0, его свойства, компоненты для работы со строками. Создание обучающих тестов на знание лексики и грамматики английского языка.

курсовая работа [521,0 K], добавлен 06.03.2016
Разработка и исследование искусственной нейронной сети для управления динамическим объектом с переменными параметрами
Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.

дипломная работа [2,6 M], добавлен 23.09.2013
Исследование методов и реализация алгоритма моделирования распространения информации в социальных сетях
Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.

дипломная работа [5,4 M], добавлен 08.02.2016
Проблемы защиты информации в компьютерных сетях
Проблема выбора между необходимым уровнем защиты и эффективностью работы в сети. Механизмы обеспечения защиты информации в сетях: криптография, электронная подпись, аутентификация, защита сетей. Требования к современным средствам защиты информации.

курсовая работа [32,1 K], добавлен 12.01.2008

Другие документы, подобные "Распространение сигналов на семантических сетях"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.