Распространение сигналов на семантических сетях
Исследование распространения сигналов на семантической сети русского языка на примере решения психологических тестов Медника. Подготовка к использованию в исследовании сети свободных ассоциаций русского языка. Возможные механизмы решения тестов Медника.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 15.09.2020 |
Размер файла | 603,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Московский институт электроники и математики им. А.Н. Тихонова
Выпускная квалификационная работа - магистерская диссертация
по направлению 01.04.02 Прикладная математика и информатика
Распространение сигналов на семантических сетях
Студент Е.С. Патрушева
Научный руководитель
к. ф.-м. н., доцент М.В. Тамм
Москва 2020
ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Московский институт электроники и математики им. А.Н. Тихонова
ЗАДАНИЕ на выполнение магистерской диссертации
студенту группы ММКТ181 Патрушевой Екатерине Сергеевне
1. Тема работы
Распространение сигналов на семантических сетях
2. Цель работы
Исследовать распространение сигналов на семантической сети русского языка на примере решения психологических тестов Медника
3. Формулировка задания
? Получить и подготовить данные о сложности русскоязычных тестов Медника
? Совместно с другими студентами из группы получить и подготовить к использованию в исследовании сеть свободных ассоциаций русского языка
? Сформулировать ряд гипотез о возможных механизмах решения тестов Медника (прямые ассоциации, цепочки ассоциаций и т.д.) и об индуцируемой этими механизмами связи сложности тестов Медника с взаимным расположением слов-символов и слова-отклика на сети ассоциаций.
? Проверить предложенные гипотезы.
Проект ВКР должен быть предоставлен студентом в срок до «15» декабря 2019 г.
Научный руководитель ВКР «13» декабря 2019 г. ______________ М.В. Тамм тест медник сигнал семантический
Первый вариант ВКР предоставлен студентом в срок до «15» марта 2020 г.
Научный руководитель ВКР «15» марта 2020 г. ______________ М.В. Тамм
Итоговый вариант ВКР предоставлен студентом в срок до «12» мая 2020 г.
Научный руководитель ВКР «12» мая 2020 г. ______________ М.В. Тамм
Задание выдано студенту «20» ноября 2019 г. ______________ М.В. Тамм
Задание принято к исполнению студентом «20» ноября 2019 г. ______________ Е.С. Патрушева
Аннотация
В данной работе рассмотрены результаты тестирования Медника на русском языке. Предложена оценка сложности тестов. Найдена взаимосвязь между сложностью троек и их расположением на семантической сети.
Annotation
In this research paper I consider results of Remote Associates Test in Russian language. I have calculated difficulty estimate for each Mednick's triads. In addition, correlation between complexity of triples and their location on the semantic network has been found.
Оглавление
1. Введение
2. Подготовка данных
3. Карта слов
4. Гипотеза №1: линейное распространение в 1 шаг
5. Гипотеза №2: линейное распространение в несколько шагов
6. Дополнение к линейному распространению
7. Гипотеза №3: нелинейное распространение
8. Вывод
Литература
Приложение
1. Введение
В психологии широко известен тест вербальной креативности Медника или, как его еще называют, тест отдаленных ассоциаций (RAT) [1-2], придуманный Сарноффом Андреем Медником в 1962 г. Испытуемому дается словесная тройка, например, {дым, игра, меч}, для которой необходимо найти слово-решение (общую устойчивую ассоциацию) {огонь}, которое образовывало бы некоторое словосочетание с каждым из слов триады. При этом образование таких словосочетаний может происходить единообразно, а может и абсолютно по-разному (тестирующий может налагать на это ограничения). Высокая скорость нахождения общей ассоциации и ее уникальность свидетельствуют об успешном прохождении тестирования, т.е. о высокой степени креативности мышления. Тройки подбираются таким образом, чтобы все испытуемые были в равных условиях, т.е. нет привязки к какой-либо узкой области. Многие психологи пытаются привнести что-то свое в этот тест, начиная с простого ограничения по времени и заканчивая снятием биологических показателей [3]. Все это делается для того, чтобы понять, как устроено человеческое мышление. Более сложные опыты помогают выявить более тонкие закономерности.
В свою очередь, до сих пор до конца не понятны механизмы нахождения общей ассоциации: влияет ли на это каждое из слов тройки или же какому-то из слов отдается предпочтение и идет перебор его ассоциаций. Если испытуемый выделяет какое-то из слов триады, то каким из методов он приходит к ответу, берет первую ассоциацию к данному слову или все же пытается строить ассоциативные цепочки? Эти и многие другие гипотезы я постараюсь проверить в своей работе.
Кроме того, не вполне понятно, чем определяется сложность тестов Медника. Целью нашего исследования является поиск связи между сложностью заданий в эксперименте Медника и взаимным расположением слов-стимулов и слова-ответа на сети свободных ассоциаций. Мы располагали сырыми данными о структуре сети свободных ассоциаций русского языка и о результатах психологических экспериментов по решению тестов Медника. Доступные нам экспериментальные данные получены в ИПИ РАН в группе профессора А. Поддъякова. О каждом испытуемом известны пол, возраст, степень и профиль образования. Кроме того, постановка эксперимента в этом случае имела одну дополнительную особенность: для каждого слова-ответа существовало не три, а четыре возможных стимула, так что имелась возможность выбрать три из них четырьмя разными способами. Таким образом, можно сказать, что каждая тройка существовала в этом эксперименте в 4 разновидностях, испытуемые получали одну из них случайным образом. Наличие такого варьируемого состава троек, как предполагается, может позволить более детально понять механизм поиска общей ассоциации.
В данной работе будут рассмотрены результаты тестирования Медника на русском языке, полученные в ИПИ РАН. Результаты тестов пройдут всю необходимую обработку. Для каждой из троек будут рассчитаны количественные характеристики, которые помогут оценить сложность тройки. Помимо всего прочего будет проверено несколько предположений о зависимости сложности тройки от ее положения на семантической сети.
2. Подготовка данных
Мною были рассмотрены данные о решении тестов Медника 68 респондентами разных возрастов мужского и женского пола, каждый из которых получил 24 тройки-стимула. Поскольку каждая тройка существовала в 4 различных вариантах (см. введение), каждый вариант теста был предложен 17 испытуемым. Для каждого испытуемого и каждой тройки были известны время решения в миллисекундах, ответ и его правильность (верно/неверно/нет ответа).
Перед началом исследования полученные данные прошли чистку и предварительную обработку, а также были сгруппированы по тройкам при помощи языка программирования Python и средств Excel (см. Приложение).
Для дальнейшего анализа необходимо каким-то образом количественно описать сложность каждого теста. В качестве возможных оценок сложности теста были рассмотрены такие характеристики, как доля решивших, среднее обратное время решения, а также более общее, зависящее от параметра , среднее ( - время решения тройки в минутах), которое при переходит в среднее обратное время решения, а при - в среднюю долю решивших. Важно отметить, что разброс времен решения для одной и той же тройки очень велик. Была поставлена задача выяснить, существует ли оптимальное значение при котором относительная дисперсия минимальна, т.е. характеристика сложности тройки лучше всего определена. С уменьшением параметра наблюдалось уменьшение дисперсии (от 0,333 при до 0,076 при ), при этом предельное значение так и не было найдено. Таким образом оказалось, что самая устойчивая характеристика сложности тройки - это доля решивших.
Тем не менее, представляется, что обратное время решения, хоть и является сильно флуктуирующей характеристикой, все же содержит важную дополнительную информацию о сложности тройки. В связи с этим в дальнейшем предполагается использовать в качестве основной характеристики сложности тройки произведение средней доли решивших и среднего обратного времени решения (см. Приложение: Табл. 1). Ниже приведен график зависимости этих двух величин (Рис. 1), коэффициент корреляции составил 0,939
Рис. 1 Диаграмма рассеяния для доли правильно решивших и среднего обратного времени решения
Чем больше будет значение такой характеристики, тем проще тройка для решения испытуемым.
3. Карта слов
«Карта слов» - это масштабный интернет-проект по созданию базы данных различного рода семантических связей между словами и выражениями в русском языке (пример в английском языке [4]). Непрерывный сбор новых данных происходит в интерактивном формате при помощи сайта проекта kartaslov.ru. Пополнение сети ассоциаций [5] происходит следующим образом: в форме игры посетителю сайта предлагается ввести все возникшие за отведённое время ассоциации, так называемые отклики, на заданное слово-стимул. Образовавшимся связям присваивается вес, обратно пропорциональный их числу, веса одинаковых связей, полученных от разных участников, суммируются.
Данный подход к сбору данных имеет определенные недостатки. Во-первых, веса в такой сети распределены очень неравномерно, поскольку через каждый стимул проходит разное число человек, к тому же каждый испытуемый никак не ограничен в количестве ассоциаций, найденных для каждого слова. Во-вторых, автоматический сбор данных не позволяет наложить ограничения на формат откликов, гарантирующие их единообразие, поэтому отклики в ассоциативной сети «Карта слов» могут принимать различные словоформы (разные число, падеж, род), а в отдельных случаях являются целыми словосочетаниями. При этом в качестве стимулов используются лишь основные формы слов. Это различие между форматами слов-стимулов и слов-ответов необходимо тем или иным образом учесть для того, чтобы сделать сеть пригодной для дальнейшего анализа методами теории сложных сетей.
Мы приняли решение рассматривать в качестве элементарного объекта, узла сети ассоциаций, не словоформу, а слово в целом, во всем многообразии его форм. В связи с этим встала задача о «склейке» различных словоформ в массиве экспериментальных данных. Моя коллега, Софья Толстоухова, произвела всю необходимую предобработку данных посредством таких библиотек Python, как NetworkX и Pymorphy, пытаясь устранить уже упомянутые недостатки метода сбора данных. Была определена доля вершин (стимул/отклик), выраженных словосочетаниями - выяснилось, что таких вершин в сети всего 4%, поэтому было принято решение пренебречь ими и исключить их из общего массива данных. Вследствие этого плотность сети увеличилась приблизительно в два раза, хотя по-прежнему осталась невелика: против первоначальных . Затем слова были приведены в нормальную форму, а совпадающие вершины были «склеены» (плотность сети возросла до ). К тому же были произведена работа с петлями и мультиребрами, которые образовались вследствие языковых преобразований. В итоговой сети 29489 вершин и 582149 ребер.
Я выражаю огромную благодарность Софье за подготовку сети, в дальнейшем она будет использоваться для поиска взаимосвязи между сложностью троек Медника и их расположением на семантической сети.
Для характеризации тройки на сети были взяты следующие статистики:
a. |
- |
максимальный in-вес для вершины (общей ассоциации) |
|
b. |
- |
суммарный in-вес для вершины |
|
c. |
- |
максимальный out-вес для вершины (общей ассоциации) |
|
d. |
- |
суммарный out-вес для вершины |
где - вес связи между вершинами и , элемент матрицы смежности для сети «Карта слов»
В сети было найдено 62 тройки, при этом 22 их них не имеют смежных вершин. Для данных троек были рассчитаны характеристики , , и , некоторые из них оказались нулевыми. Самое большое значение = 0,0878 было у тройки {дым, игра, меч} огонь, а самое маленькое (0) {вопрос, бес, Адам} ребро. В свою очередь максимальным значением = 0,1175 обладает тройка {мальчик, дамский, облизать} пальчик, а наименьшим (0) {древо, собираться, течение} мысль.
4. Гипотеза №1: линейное распространение в 1 шаг
Давайте попытаемся разобраться в том, как происходит процесс нахождения общей ассоциации. Логично предположить, что испытуемый рассматривает каждое слово тройки по отдельности, пытаясь подобрать к нему как можно больше ассоциаций. Когда находится некоторое слово, которое ассоциируется с каждым из 3х слов, можно считать, что ответ найден. При таком подходе к нахождению решения суммарный вес связей между словами-стимулами и словом-решением должен быть тем больше, чем проще тройка (меньше время решения).
Рис. 2 Диаграмма рассеяния для оценки сложности и
Как видно из графика (Рис. 2) сложность тройки никак не коррелирует ( = 0,00007) с суммарным весом тройки на сети. Значит такое предположение неверно, но может есть связь между максимальной связью между стимулом и ответом в рамках тройки?
Рис. 3 Диаграмма рассеяния для оценки сложности и
Но и в данном случае мы не наблюдаем зависимости ( = 0,0082) (Рис. 3), оно и не удивительно, ведь эти две величины и положительно коррелированы ( = 0,984).
Следовательно, механизм нахождения общей ассоциации устроен намного сложнее.
5. Гипотеза №2: линейное распространение в несколько шагов
Вероятнее всего испытуемые не просто ищут ассоциации к каждому слову триады, а составляют целые ассоциативные цепочки длины не более чем 1, 2 и бесконечность соответственно, т.е. каждая новая ассоциация порождает следующую. Первое слово, которое содержится в каждой из таких цепочек, стает ответом на тройку. Чтобы учесть все возможные варианты цепочек, рассчитаем матрицу :
где - матрица смежности сети «Карта слов»
Также вычислим все статистики по аналогии с матрицей . В данном случае тоже должно происходить сложение эффектов, т.е. чем больше суммарный вес in-вес для слова-ответа , тем проще для решения будет тройка.
В ходе вычислений выяснилось, что , а значит мы не можем найти обратную матрицу, в связи с этим рассмотрим наибольшую сильно связную компоненту сети для проверки гипотезы. В состав данной компоненты входит 17 троек Медника.
Рис. 4 Диаграмма рассеяния для оценки сложности и
В данном случае наблюдается очень слабая отрицательная корреляция () между оценкой сложности триады и суммарным весом по матрице (Рис. 4). Это довольно необычный результат, который может указывать на то, что линейность не совсем применима к процессу нахождения общей ассоциации, либо нам не достает данных для достоверных результатов.
Поскольку и в данном случае и положительно коррелированы (= 0,98), наблюдаем аналогичную ситуацию (Рис. 5) с коэффициентом корреляции для
Рис. 5 Диаграмма рассеяния для оценки сложности и
Скорее всего причина отсутствия прямой линейной зависимости (в 1 и множество шагов) между стимулами и откликом кроется в том, что авторы, составлявшие данные тесты Медника, делали упор на поиск ассоциаций через общие фразеологизмы. Например, чуть ли не самая сильная из имеющихся в этих словах ассоциация - это глаз лоб (1,204), но для испытуемых вероятнее всего она связана просто с анатомией, а "глаза на лоб полезли" дает очень незначительный вклад в данную связь. Поэтому получается, что поиск ассоциаций специального вида (как в тестах Медника) и поиск ассоциаций вообще (Карта слов) - не одно и то же.
6. Дополнение к линейному распространению
Помимо всего прочего отмечена значительная отрицательная корреляция () между сложностью тройки и весом ассоциаций от слова-ответа к словам-стимулам (Рис. 6), чего мы не видели на английской сети [6]. Это может означать, что испытуемые находят слово-ответ, но не распознают его как решение в случаях, когда ассоциации от ответа к стимулам слишком слабые.
Рис. 6 Диаграмма рассеяния для оценки сложности и
Чем больше слово-ответ ассоциируется со словами триады, тем проще решить тройку. Довольно интересно, почему линейный принцип не работает в одну и работает в другую сторону. Возможно это связано с тем, что слова тройки могут взаимодействовать между собой намного сложнее, создавать некоторую синергию.
Что касается многошаговой линейной гипотезы, здесь наблюдается хоть и слабая, но положительная зависимость между оценкой сложности и (Рис. 7) со значением коэффициента корреляции 0,316. К сожалению, значимым такое наблюдение мы считать не можем.
Рис. 7 Диаграмма рассеяния для оценки сложности и
7. Гипотеза №3: нелинейное распространение
Как ведет себя сложность четверок при превращении их в тройки разными способами. С этой точки зрения все четверки можно разделить на 4 группы, две первые довольно скучные, две следующие - явно гораздо более интересные (Табл. 2).
Табл. 2
Классификация троек Медника
слово_1 |
слово_2 |
слово_3 |
слово_4 |
ответ |
тип |
||
1 |
ад |
друг |
порочный |
ходить |
круг |
ровная |
|
2 |
часы |
банк |
сыр |
шоколад |
швейцарский |
ровная |
|
3 |
жесткость |
вопрос |
бес |
Адам |
ребро |
3:1 |
|
4 |
алмаз |
говорить |
лоб |
край |
глаз |
2:2 |
|
5 |
ком |
первый |
голова |
дождь |
снег |
2:2 |
|
6 |
крепкий |
Иван |
давать |
гонять |
чай |
2:2 |
|
7 |
хлеб |
живой |
глядеть |
гусь |
вода |
ровная |
|
8 |
дамский |
облизать |
погрозить |
мальчик |
палец |
ровная |
|
9 |
лебединый |
петля |
сесть |
дать |
шея |
3:1 |
|
10 |
собираться |
течение |
задний |
древо |
мысль |
2:2 |
|
11 |
мотать |
дуть |
сам |
шевелить |
усы |
1:3 |
|
12 |
предавать |
игра |
меч |
дым |
огонь |
1:3 |
|
13 |
ум |
камень |
чистый |
нож |
сердце |
ровная |
|
14 |
капля |
колено |
открытый |
погода |
море |
3:1 |
|
15 |
слоновый |
кожа |
лечь |
мозг |
кость |
1:3 |
|
16 |
полный |
конь |
событие |
пустить |
ход |
3:1 |
|
17 |
ученый |
мешок |
хвост |
сапоги |
кот |
ровная |
|
18 |
седина |
синий |
отпустить |
анекдот |
борода |
ровная |
|
19 |
пила |
красный |
мясо |
лед |
рыба |
2:2 |
|
20 |
висячий |
семь |
рот |
посадить |
замок |
1:3 |
|
21 |
съесть |
сено |
зарыть |
вешать |
собака |
3:1 |
|
22 |
слух |
сон |
русский |
переводить |
дух |
1:3 |
|
23 |
танец |
стих |
дом |
медведь |
белый |
ровная |
|
24 |
шляпа |
техника |
табак |
грешный |
дело |
1:3 |
1. Ровные четверки: все четыре соответствующие тройки имеют близкую сложность (разница между самым сложным и самым простым вариантом не более, чем в 2-2,5 раза). Это в основном простые тройки типа {дамский, облизать, погрозить, мальчик} пальчик или {ученый, мешок, хвост, сапоги} кот.
2. Четверки с явным словом-лидером (я предлагаю назвать их четверками типа 1:3): если одно из четырех слов есть в варианте, то вариант простой, если этого слова нет - вариант сложный. Например, в четверке {мотать, дуть, сам, шевелить} усы таким явным лидером является слово "мотать": вариант {дуть, сам, шевелить} оказывается примерно в 5 раз сложнее, чем все три варианта, содержащие слово "мотать". Аналогичная ситуация, например, в тройке {шляпа, техника, табак, грешный} дело, где варианты, содержащие слово "шляпа", оказываются в 3-7 раз проще, чем вариант {техника, табак, грешный}.
3. Третий, более интересно устроенный вариант - это тройки типа 3:1, в которых один из вариантов оказывается намного проще остальных. Такое ощущение, что в этих четверках есть "блокирующее слово", наличие которого в выдаче делает тройку более сложной. Как правило, этот эффект выражен слабее, чем в тройках типа 1:3, так что нельзя исключить того, что мы имеем дело с экспериментальным шумом. Ярче всего ситуация видна для четверки {дать, сесть, лебединый, петля} шея, где все варианты со словом "дать" оказываются как минимум в 2,5 раза сложнее, чем вариант {сесть, лебединый, петля}. Возможно, дело в том, что слово "дать", будучи одним из самых употребительных глаголов, порождает у испытуемых такой фейерверк разнородных ассоциаций, что он мешают решению.
4. Наконец, пожалуй, самый интересный класс - это тройки типа 2:2, т.е. тройки, которые оказываются относительно простыми тогда и только тогда, когда в выдаче есть какие-то два из четырех слов. Например, в четверке {первый, ком, дождь, голова} снег варианты, содержащие слова "первый" и "ком", т.е. {первый, ком, голова} и {первый, ком, дождь}) почти не отличаются по сложности, и оба они в 5-9 раз проще, чем остальные два варианта ({первый, голова, дождь} и {ком, голова, дождь}. Другие варианты, в которых происходит что-то похожее:
{алмаз, лоб, край, говорить} глаз ("важные" слова - алмаз и говорить)
{крепкий, Иван, гонять, давать} чай ("важные" слова - крепкий и Иван)
{собираться, течение, задний, древо} мысль ("важные" слова - собираться и течение)
{пила, красный, мясо, лед} рыба ("важные" слова - пила и красный)
Отмечу, однако, что во всех этих четырех четверках эффект несколько слабее, при этом все эти четыре тройки - довольно сложные, так что статистическая достоверность этого наблюдения пока довольно низкая.
Поведение ровных четверок и четверок типа 1:3 согласуется с гипотезой (теорией) линейного распространения, в таком случае слова между собой никак не взаимодействуют, а их эффекты просто складываются. Но, если я правильно понимаю, в мире, работающем по этим теориям, не могут существовать четверки типа 3:1 или 2:2.
При этом поведение четверок типа 3:1, кажется, можно объяснить относительно малой кровью, если предположить, что высокочастотные слова типа "дать" притягивают внимание испытуемых больше, чем более редкие слова. По сути, тут опять можно обойтись без содержательного взаимодействия между словами-стимулами, нужно просто на этапе "испытуемый наугад выбирает одно слово" добавить какие-то дополнительные веса, описывающие этот выбор. Тогда слово с большим весом и "плохими" с точки зрения решения ассоциациями будет работать блокирующим.
Наконец, тройки типа 2:2 явно устроены более сложно: в них, в отличие от всех остальных, имеется какая-то синергия между словами: для решения недостаточно только слова А или слова В, нужно, чтобы в выдачу они попали оба одновременно. Это явление можно добавить в модель только через какую-то нелинейность. Что-нибудь вроде того, что испытуемый обследует все возможные пары слов из тройки и ищет общие ассоциации к парам (т.е. слова, вес ассоциаций которых с каждым из двух из них выше некоторого порогового) и добавляет это слово к ядру поиска.
8. Вывод
В данной работе были рассмотрены результаты русскоязычного тестирования Медника, полученные в ИПИ РАН в группе профессора А. Поддъякова. Данные прошли всю необходимую предобработку с помощью языка программирования Python. Была предложена оценка сложности тестов Медника. Посредством Excel были вычислены оценка сложности троек и сопутствующие характеристики.
Затем были выдвинуты и проверены предположения о взаимосвязи сложности троек Медника с их топологией на семантической сети. Для этого были рассчитаны такие характеристики, как , , и . При проверке гипотез было отмечено следующее:
1. То, как сильно ассоциативно связаны слова-стимулы со словом-ответом, никак не влияет на скорость решения (сложность) тройки.
2. При этом ассоциативная связь ответа со стимулами упрощает тройку для решения: чем больше ответ ассоциируется со словами-стимулами, тем проще тройка.
3. Слова в тройке взаимодействуют между собой сложнее, чем линейно, когда эффекты стимулов просто складываются. Были выделены 4 сценария таких взаимодействий.
Такое исследование может иметь продолжение, например, можно опросить больше участников и проверить гипотезы о поле и возрасте испытуемых или же сравнить результаты тестирования еще и с другими семантическими сетями.
Литература
1. Mednick S.A. The associative basis of the creative process// Psychological Review. 1962. 69, 220-232
2. Mednick S.A. Remote Associates Test// Journal of Creative Behavior. 1968. 2, 213-214
3. Bowden E. M., Jung-Beeman M. Normative data for 144 compound remote associate problems// Behavior Research Methods, Instruments, & Computers. 2003. 35 (4), 634-639
4. https://wordnet.princeton.edu
5. Newman M. E. J. Networks: an introduction. Oxford University Press 2010
6. Зверева М.В. Структура и свойства семантических сетей// База МГУ. 2019
7. Nelson D.L., Mcevoy C.L., Schreiber T.A. The University of South Florida free association, rhyme, and word fragment norms// Behavior Research Methods, Instruments, & Computers. 2004. 36 (3), 402-407
Приложение
Табл. 1
Характеристики троек Медника
№ |
Attribute1 |
Attribute2 |
Attribute3 |
Answer |
Solve Ratio |
Av.Inv.Time |
Diff.Est. |
|
1 |
ад |
друг |
порочный |
круг |
0,941 |
4,116 |
3,874 |
|
ад |
ходить |
друг |
круг |
0,588 |
4,512 |
2,654 |
||
ад |
ходить |
порочный |
круг |
0,647 |
7,680 |
4,969 |
||
ходить |
друг |
порочный |
круг |
0,941 |
7,431 |
6,994 |
||
2 |
часы |
банк |
сыр |
швейцарский |
0,412 |
5,308 |
2,186 |
|
часы |
банк |
шоколад |
швейцарский |
0,412 |
2,795 |
1,151 |
||
часы |
сыр |
шоколад |
швейцарский |
0,471 |
5,147 |
2,422 |
||
банк |
сыр |
шоколад |
швейцарский |
0,647 |
7,566 |
4,896 |
||
3 |
вопрос |
бес |
Адам |
ребро |
0,176 |
1,508 |
0,266 |
|
жесткость |
бес |
Адам |
ребро |
0,294 |
1,286 |
0,378 |
||
жесткость |
вопрос |
Адам |
ребро |
0,235 |
0,603 |
0,142 |
||
жесткость |
вопрос |
бес |
ребро |
0,412 |
2,128 |
0,876 |
||
4 |
говорить |
алмаз |
край |
глаз |
0,176 |
0,681 |
0,120 |
|
лоб |
алмаз |
край |
глаз |
0,059 |
0,179 |
0,011 |
||
лоб |
говорить |
алмаз |
глаз |
0,294 |
1,414 |
0,416 |
||
лоб |
говорить |
край |
- |
0,000 |
||||
5 |
голова |
первый |
ком |
снег |
0,882 |
1,954 |
1,724 |
|
дождь |
голова |
ком |
снег |
0,235 |
0,281 |
0,066 |
||
дождь |
голова |
первый |
снег |
0,118 |
0,167 |
0,020 |
||
дождь |
первый |
ком |
снег |
0,647 |
2,092 |
1,354 |
||
6 |
гонять |
Иван |
давать |
чай |
0,118 |
0,292 |
0,034 |
|
гонять |
крепкий |
Иван |
чай |
0,235 |
1,380 |
0,325 |
||
гонять |
крепкий |
давать |
чай |
0,176 |
0,512 |
0,090 |
||
крепкий |
Иван |
давать |
чай |
0,471 |
2,067 |
0,973 |
||
7 |
хлеб |
живой |
глядеть |
вода |
0,235 |
0,513 |
0,121 |
|
гусь |
живой |
глядеть |
вода |
0,235 |
1,541 |
0,363 |
||
гусь |
хлеб |
глядеть |
вода |
0,353 |
1,219 |
0,430 |
||
гусь |
хлеб |
живой |
вода |
0,176 |
1,502 |
0,265 |
||
8 |
дамский |
облизать |
погрозить |
палец |
0,882 |
6,452 |
5,693 |
|
мальчик |
дамский |
облизать |
пальчик |
0,824 |
9,186 |
7,565 |
||
мальчик |
дамский |
погрозить |
пальчик |
0,941 |
7,753 |
7,297 |
||
мальчик |
облизать |
погрозить |
пальчик |
0,824 |
5,918 |
4,874 |
||
9 |
дать |
петля |
лебединый |
шея |
0,176 |
0,442 |
0,078 |
|
дать |
сесть |
лебединый |
шея |
0,059 |
0,461 |
0,027 |
||
дать |
сесть |
петля |
шея |
0,059 |
0,428 |
0,025 |
||
сесть |
петля |
лебединый |
шея |
0,353 |
1,167 |
0,412 |
||
10 |
древо |
собираться |
течение |
мысль |
0,176 |
0,632 |
0,111 |
|
задний |
древо |
собираться |
мысль |
0,118 |
0,118 |
0,014 |
||
задний |
древо |
течение |
мысль |
0,059 |
0,120 |
0,007 |
||
задний |
собираться |
течение |
мысль |
0,176 |
1,075 |
0,190 |
||
11 |
дуть |
мотать |
сам |
ус |
0,765 |
6,928 |
5,298 |
|
дуть |
мотать |
шевелить |
ус |
0,706 |
8,188 |
5,780 |
||
дуть |
сам |
шевелить |
усы |
0,294 |
0,925 |
0,272 |
||
мотать |
сам |
шевелить |
ус |
0,882 |
9,519 |
8,399 |
||
12 |
дым |
игра |
меч |
огонь |
0,353 |
0,742 |
0,262 |
|
дым |
игра |
предавать |
огонь |
0,176 |
0,417 |
0,074 |
||
дым |
меч |
предавать |
огонь |
0,235 |
0,565 |
0,133 |
||
игра |
меч |
предавать |
- |
0,000 |
||||
13 |
камень |
чистый |
нож |
сердце |
0,118 |
0,089 |
0,010 |
|
камень |
чистый |
ум |
сердце |
0,059 |
0,083 |
0,005 |
||
камень |
нож |
ум |
- |
0,000 |
||||
чистый |
нож |
ум |
- |
0,000 |
||||
14 |
капля |
открытый |
погода |
море |
0,235 |
0,964 |
0,227 |
|
колено |
капля |
открытый |
море |
0,353 |
0,700 |
0,247 |
||
колено |
капля |
погода |
море |
0,412 |
1,420 |
0,585 |
||
колено |
открытый |
погода |
море |
0,059 |
0,222 |
0,013 |
||
15 |
кожа |
лечь |
мозг |
кость |
0,235 |
0,429 |
0,101 |
|
кожа |
слоновый |
лечь |
кость |
0,412 |
1,928 |
0,794 |
||
кожа |
слоновый |
мозг |
кость |
0,471 |
1,271 |
0,598 |
||
слоновый |
лечь |
мозг |
кость |
0,412 |
1,223 |
0,503 |
||
16 |
конь |
пустить |
событие |
ход |
0,176 |
0,493 |
0,087 |
|
полный |
конь |
пустить |
ход |
0,059 |
0,056 |
0,003 |
||
полный |
конь |
событие |
ход |
0,176 |
1,815 |
0,320 |
||
полный |
пустить |
событие |
- |
0,000 |
||||
17 |
мешок |
хвост |
сапоги |
кот |
0,588 |
3,633 |
2,137 |
|
ученый |
мешок |
сапоги |
кот |
0,647 |
7,192 |
4,653 |
||
ученый |
мешок |
хвост |
кот |
0,706 |
5,543 |
3,913 |
||
ученый |
хвост |
сапоги |
кот |
0,765 |
4,230 |
3,235 |
||
18 |
отпустить |
анекдот |
седина |
борода |
0,706 |
4,707 |
3,323 |
|
синий |
анекдот |
седина |
борода |
0,588 |
3,890 |
2,288 |
||
синий |
отпустить |
анекдот |
борода |
0,412 |
3,129 |
1,288 |
||
синий |
отпустить |
седина |
борода |
0,824 |
8,216 |
6,766 |
||
19 |
пила |
красный |
лед |
рыба |
0,353 |
1,561 |
0,551 |
|
пила |
мясо |
красный |
рыба |
0,412 |
2,382 |
0,981 |
||
пила |
мясо |
лед |
рыба |
0,235 |
0,426 |
0,100 |
||
мясо |
красный |
лед |
- |
0,000 |
||||
20 |
рот |
висячий |
посадить |
замок |
0,353 |
2,235 |
0,789 |
|
семь |
висячий |
посадить |
замок |
0,176 |
1,199 |
0,212 |
||
семь |
рот |
висячий |
замок |
0,353 |
1,810 |
0,639 |
||
семь |
рот |
посадить |
замок |
0,118 |
0,343 |
0,040 |
||
21 |
сено |
зарыть |
вешать |
собака |
0,176 |
1,506 |
0,266 |
|
сено |
съесть |
вешать |
собака |
0,412 |
1,820 |
0,750 |
||
сено |
съесть |
зарыть |
собака |
0,647 |
3,833 |
2,480 |
||
съесть |
зарыть |
вешать |
собака |
0,235 |
1,277 |
0,300 |
||
22 |
слух |
русский |
переводить |
дух |
0,118 |
0,180 |
0,021 |
|
слух |
сон |
русский |
дух |
0,235 |
0,489 |
0,115 |
||
сон |
русский |
переводить |
дух |
0,118 |
0,535 |
0,063 |
||
слух |
сон |
переводить |
- |
0,000 |
||||
23 |
стих |
медведь |
дом |
белый |
0,471 |
2,015 |
0,948 |
|
танец |
медведь |
дом |
белый |
0,235 |
1,848 |
0,435 |
||
танец |
стих |
дом |
белый |
0,471 |
3,268 |
1,538 |
||
танец |
стих |
медведь |
белый |
0,471 |
3,031 |
1,426 |
||
24 |
табак |
техника |
грешный |
дело |
0,118 |
0,176 |
0,021 |
|
шляпа |
табак |
грешный |
дело |
0,176 |
1,100 |
0,194 |
||
шляпа |
табак |
техника |
дело |
0,412 |
2,252 |
0,927 |
||
шляпа |
техника |
грешный |
дело |
0,353 |
1,789 |
0,631 |
# Фрагменты кода на Python
# Поиск троек на сети
# Вычисление характеристик троек на сети (матрица А)
# Вычисление характеристик троек на сети (матрица В)
#Корреляция и графики
Размещено на Allbest.ru
Подобные документы
Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.
контрольная работа [1,4 M], добавлен 28.01.2011Выбор цели тестирования, составление структурно-логической схемы проверяемого учебного материала и тестовых заданий. Конструирование базы заданий, требования к оформлению, составление эталона и апробация тестов. Материалы тестов целевого назначения.
курсовая работа [86,3 K], добавлен 19.07.2011Разработка программного обеспечения, предназначенного для предоставления трех способов прохождения тестов для студентов. Построение модели потоков данных, физической базы данных. Выбор языка программирования. Условия эксплуатации, требования к надежности.
дипломная работа [2,7 M], добавлен 18.04.2014Описание компиляторов языка С/С++: MinGW, Borland Builder, Watcom, Intel C++, Visual. Сравнение характеристик выполнения программ на примере простого кода. Проведение тестов для компиляторов, оценка скорости выполнения и компилирования, их опций.
курсовая работа [1,6 M], добавлен 05.10.2012Понятие и характеристика открытой системы образовательных тестов (ОСОТ). Ее преимущества и недостатки, их сущность. Алгоритм работы с системой, детальное описание процесса. Установка системы на сервер и ее использование. Изложение алгоритма решения.
доклад [28,1 K], добавлен 25.02.2009Выбор технологии, языка и среды программирования. Анализ процесса обработки информации и выбор структур данных для ее хранения, разработка основных алгоритмов. Проектирование интерфейса пользователя. Выбор стратегии тестирования и разработка тестов.
курсовая работа [332,3 K], добавлен 09.12.2014Разработка программы автоматизации процесса проверки знаний учащихся. Использование языка программирования Borland Delphi 7.0, его свойства, компоненты для работы со строками. Создание обучающих тестов на знание лексики и грамматики английского языка.
курсовая работа [521,0 K], добавлен 06.03.2016Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.
дипломная работа [2,6 M], добавлен 23.09.2013Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.
дипломная работа [5,4 M], добавлен 08.02.2016Проблема выбора между необходимым уровнем защиты и эффективностью работы в сети. Механизмы обеспечения защиты информации в сетях: криптография, электронная подпись, аутентификация, защита сетей. Требования к современным средствам защиты информации.
курсовая работа [32,1 K], добавлен 12.01.2008