Нечіткі множини у лінгвістиці
Визначення відносної повторюваності деяких букв в українській і російській літературах. Використання нечітких множин при читанні зашифрованих і древніх текстів. Аналіз залежності цифрових показників тексту від мовних аспектів та індивідуальності автора.
| Рубрика | Иностранные языки и языкознание |
| Вид | статья |
| Язык | украинский |
| Дата добавления | 27.10.2022 |
| Размер файла | 18,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Луцький Національний Технічний Університет
Нечіткі множини у лінгвістиці
Я.М. Курінний. П.В. Лимар. О.В. Мрочко - ст.гр. ІФ-21,
Анотація
Визначено відносну повторюваність у вигляді нечітких множин у літературних текстах українською та російською мовами. Показано, що повторюваність деяких букв у таких текстах є разючою. Запропонований підхід з використанням нечітких множин може бути використаний при читанні зашифрованих текстів. текстів древніх мов і т.п.
Вступ
Постановка проблеми. Останнім часом з боку РФ надходять твердження, що російські та українські народи - один народ. У дослідженні, що пропонується, ставиться за мету спростувати подібне твердження.
Аналіз останніх досліджень і публікацій. Подібних досліджень і публікацій на означену тему нам знайти не вдалось. Можливо подібні дослідження виконуються вперше.
Мета дослідження. Визначити відносну повторюваність у вигляді нечітких множин у літературних текстах українською та російською мовами.
Вступ. Нечітка множина - поняття введене Лотфі Заде у 1965 році [1,2]. Основним поняттям теорії нечітких множин є визначення нечіткої множини. Універсум - це множина. яка містить усі можливі елементи в рамках контексту визначеної предметної області. у нашому дослідженні це всі спільні літери української та російської абетки. Універсум. зазвичай. позначається літерою “U”. Елементами нечіткої множини є елементи універсуму, біля кожного з яких позначено (найчастіше у вигляді індексу) відносна його повторюваність.
Результати досліджень
У роботі досліджено літературні тексти [315], до розгляду приймались об'єми, що охоплювали кілька тисяч символів, за винятком байок [3,4], де до аналізу взято 750...800 символів. Результати досліджень представлені у таблицях. повторюваність мовний буква текст
|
Буква алфавіт у |
Відносна повторюванність у тексті |
||||||||
|
[3] |
[4] |
[5] |
[6] |
[7] |
[8] |
[9] [10 |
10 [10] |
||
|
А |
0.0.102 |
0.0.071 |
0.0.096 |
0.062 |
0.092 |
0.0.102 |
0.081 |
0.096 |
|
|
Б |
0 0.028 |
0. 0.01 9 |
0.0.026 |
0.012 |
0.023 |
0.0.019 |
0.022 |
0.018 |
|
|
В |
0 0.046 |
0.0.393 |
0 0.043 |
0.040 |
0.059 |
0.0.049 |
0.061 |
0.037 |
|
|
Г |
0.0.012 |
0.0.028 |
0.0.008 |
0.032 |
0.018 |
0 0.022 |
0.016 |
0.017 |
|
|
Д |
0.0.031 |
0.0.04 0 |
0.0.055 |
0.042 |
0.038 |
0.0.032 |
0.032 |
0.033 |
|
|
Е (Э) |
0.060 |
0.006 |
0.052 |
0.011 |
0.047 |
0.047 |
0.055 |
0.001 |
|
|
Є (Е) |
0.010 |
0.084 |
0.055 |
0.108 |
0.003 |
0.088 |
0.003 |
0.087 |
|
|
Ж |
0.010 |
0.013 |
0.016 |
0.010 |
0.014 |
0.011 |
0.009 |
0.012 |
|
|
З |
0.010 |
0.013 |
0.035 |
0.010 |
0.026 |
0.018 |
0.025 |
0.018 |
|
|
И (Ы) |
0.070 |
0.018 |
0.050 |
0.010 |
0.071 |
0.016 |
0.066 |
0.017 |
|
|
І (И) |
0.036 |
0.062 |
0.050 |
0.070 |
0.051 |
0.068 |
0.052 |
0.067 |
|
|
Й |
0.010 |
0.014 |
0.017 |
0.002 |
0.021 |
0.013 |
0.017 |
0.012 |
|
|
К |
0.044 |
0.025 |
0.040 |
0.036 |
0.042 |
0.033 |
0.038 |
0.037 |
|
|
Л |
0.049 |
0.053 |
0.045 |
0.032 |
0.041 |
0.046 |
0.045 |
0.048 |
|
|
М |
0.024 |
0.039 |
0.014 |
0.038 |
0.026 |
0.036 |
0.033 |
0.029 |
|
|
Н |
0.057 |
0.074 |
0.043 |
0.052 |
0.043 |
0.069 |
0.059 |
0.061 |
|
|
О |
0.097 |
0.096 |
0.11 |
0.082 |
0.114 |
0.121 |
0.119 |
0.099 |
|
|
П |
0.027 |
0.024 |
0.026 |
0.025 |
0.032 |
0.023 |
0.027 |
0.031 |
|
|
Р |
0.047 |
0.036 |
0.05 |
0.042 |
0.048 |
0.046 |
0.039 |
0.044 |
|
|
С |
0.047 |
0.046 |
0.04 |
0.057 |
0.04 |
0.056 |
0.044 |
0.055 |
|
|
Т |
0.053 |
0.044 |
0.05 |
0.075 |
0.047 |
0.061 |
0.058 |
0.057 |
|
|
У |
0.034 |
0.034 |
0.032 |
0.061 |
0.034 |
0.030 |
0.037 |
0.032 |
|
|
Ф |
0.001 |
0.001 |
0.001 |
0.002 |
0.002 |
0.003 |
0.002 |
0.001 |
|
|
Х |
0.010 |
0.017 |
0.008 |
0.002 |
0.016 |
0.009 |
0.014 |
0.006 |
|
|
Ц |
0.010 |
0.004 |
0.002 |
0.002 |
0.007 |
0.002 |
0.009 |
0.002 |
|
|
Ч |
0.024 |
0.01 5 |
0.004 |
0.018 |
0.014 |
0.017 |
0.016 |
0.014 |
|
|
Ш |
0.003 |
0.008 |
0.008 |
0.01 |
0.008 |
0.009 |
0.008 |
0.009 |
|
|
Щ |
0.010 |
0 |
0.008 |
0 |
0.007 |
0.002 |
0.008 |
0.002 |
|
|
Ь |
0.022 |
0.027 |
0.026 |
0.021 |
0.023 |
0,002 |
0.015 |
0.018 |
|
|
Ю |
0.017 |
0.004 |
0.01 |
0.002 |
0.010 |
0.010 |
0.008 |
0.003 |
|
|
Я |
0.026 |
0.02 0 |
0.008 |
0.017 |
0.021 |
0.017 |
0.025 |
0.022 |
|
Буква алфавіт у |
Відносна повторюванність у тексті |
|||||
|
[11] |
[12] |
[13] |
[14] |
[15] |
||
|
А |
0,101 |
0,086 |
0,080 |
0,078 |
0,080 |
|
|
Б |
0,020 |
0,024 |
0,023 |
0,018 |
0,012 |
|
|
В |
0,047 |
0,056 |
0,060 |
0,045 |
0,047 |
|
|
Г |
0,016 |
0,017 |
0,020 |
0,019 |
0,025 |
|
|
Д |
0,035 |
0,036 |
0,036 |
0,034 |
0,032 |
|
|
Е (Э) |
0,053 |
0,054 |
0,050 |
0,003 |
0,001 |
|
|
Є (Е) |
0,008 |
0,011 |
0,003 |
0,084 |
0,079 |
|
|
Ж |
0,011 |
0,010 |
0,009 |
0,011 |
0,011 |
|
|
З |
0,026 |
0,025 |
0,023 |
0,018 |
0,017 |
|
|
И (Ы) |
0,073 |
0,069 |
0,077 |
0,016 |
0,018 |
|
|
І (И) |
0,046 |
0,051 |
0,057 |
0,069 |
0,075 |
|
|
Й |
0,018 |
0,018 |
0,018 |
0,012 |
0,013 |
|
|
К |
0,036 |
0,042 |
0,034 |
0,033 |
0,038 |
|
|
Л |
0,038 |
0,047 |
0,039 |
0,047 |
0,054 |
|
|
М |
0,037 |
0,028 |
0,030 |
0,029 |
0,030 |
|
|
Н |
0,029 |
0,060 |
0,052 |
0,065 |
0,066 |
|
|
О |
0,041 |
0,100 |
0,098 |
0,113 |
0,114 |
|
|
П |
0,043 |
0,027 |
0,026 |
0,027 |
0,030 |
|
|
Р |
0,069 |
0,054 |
0,042 |
0,039 |
0,047 |
|
|
С |
0,036 |
0,045 |
0,045 |
0,050 |
0,050 |
|
|
Т |
0,012 |
0,052 |
0,053 |
0,065 |
0,051 |
|
|
У |
0,008 |
0,045 |
0,034 |
0,027 |
0,031 |
|
|
Ф |
0,014 |
0,000 |
0,002 |
0,002 |
0,002 |
|
|
Х |
0,010 |
0,010 |
0,012 |
0,009 |
0,010 |
|
|
Ц |
0,006 |
0,004 |
0,006 |
0,004 |
0,006 |
|
|
Ч |
0,021 |
0,016 |
0,014 |
0,020 |
0,013 |
|
|
Ш |
0,017 |
0,009 |
0,009 |
0,008 |
0,009 |
|
|
Щ |
0,024 |
0,007 |
0,007 |
0,002 |
0,002 |
|
|
Ь |
0,101 |
0,020 |
0,013 |
0,021 |
0,016 |
|
|
Ю |
0,020 |
0,012 |
0,007 |
0,008 |
0,005 |
|
|
Я |
0,047 |
0,027 |
0,023 |
0,022 |
0,016 |
Висновки
Виявлено певні закономірності, а саме: конкретні букви, незалежно від кількості перевірених символів у тексті, зберігають різницю показників повторюваності. Наприклад, у творах «Катерина» Т. Шевченка та «Онегин» О. Пушкіна, в яких ми дослідили уривки по 1500 символів, буква «И (Ы)» зустрічається 106 і 28 разів, відповідно в українському тексті ця буква зустрічається частіше. У всіх наступних творах ми можемо прослідкувати таку ж статистику.
Буква «О» є найчастішою в обох мовах і не залежно від кількості символів (342 символи в байці Глібова, та 7000 символів в уривку твору В. Шкляра) ця літера займає майже 0,1 від усього тексту.
Основна відміність припадає на голосні звуки, так звук «Е (Э)» в українській мові є частішим ніж в російський, ця закономірність прослідковується не залежно від епохи та автора.
За отриманими показниками із наведеної таблиці є можливість підсумувати залежність цифрових показників тексту від мовних аспектів та її носіїв. Ми розглянули низку жанрів, щоб зрозуміти їх вплив на зміну статистики у нечітких множинах, що зображають приблизний показник схожості між текстами, написаними на різних мовах, та авторах, які є чудовими прикладами індивідуальності, що адекватно відображається на реальності поданих нами даних. Отже, за результатами виконаного дослідження, ми можемо бути твердо впевнені, що кожна мова є унікальною, адже присутня велика різниця у показниках повторюваності таких літер (И, І, Е, Є, С).
Перелік джерел посилання
l. Z.A. Zadeh. Fuzzy sets. Information and control. vol. 8 (1965). pp. 338-353.
2. Z.A. Zadeh. Similarity relations and fuzzy orderings. Information sciences. vol. 3 (1971). pp. 177-200.
3. Т.Г. Шевченко «Катерина». http://litopys.org.ua/shevchenko/shev128.htm
4. А. С. Пушкін «Евгений Онєгин». https://ilibrary.ru/text/436/p.1/index.html
5. Л. І. Глібов «Вівці та собаки». https://traditions.in.ua/usna-narodna-tvorchist/baiky/1259- vivtsi-ta-sobaky-baika-l-glibova
6. И.А. Крылов «Трудолюбивый медведь». https://rvb.ru/18vek/krylov/01text/vol3/01fables/171.htm
7. П. Куліш «Чорна рада». https://www.ukrlib.com.ua/books/printit.php?tid=1084
8. Л. Н. Толстой «Война и мир». https://ilibrary.ru/text/11/index.html
9. В. Шкляр «Чорний ворон». https://www.ukrlib.com.ua/books/printit.php?tid=10350
10. А. Н. Рыбаков «Дети Арбата». http://loveread.ec/view_global.php?id=4647
11. Т. Г. Шевченко «Сон» . https://www.ukrlib.com.ua/books/printit.php?tid=3979
12. Леся Українка «Лісова Пісня». - https://www.ukrlib.com.ua/books/printit.php?tid=508
13.І. Франко «Фарбований Лис». https://www.ukrlib.com.ua/books/printit.php?tid=652
14. Ф. М. Достоевский «Идиот». https://ilibrary.ru/text/94/index.html
15. И. С. Тургенєв «Отцы и дети». https://ilibrary.ru/text/96/index.html
Размещено на Allbest.ru
Подобные документы
Текст як добуток мовотворчого процесу, що володіє завершеністю. Історія формування лінгвістики тексту. Лінгвістичний аналіз художнього тексту. Інформаційна самодостатність як критерій тексту. Матеріальна довжина текстів. Поняття прототипових текстів.
реферат [25,1 K], добавлен 30.01.2010Дослідження структури та складових англомовних письмових рекламних текстів, аналіз і правила їх написання. Загальні характеристики поняття переклад. Визначення лексико-семантичних особливостей перекладу англомовних туристичних рекламних текстів.
курсовая работа [44,7 K], добавлен 23.07.2009Основні класифікації текстів і методи перекладу. Дослідження термінології в науково технічному стилі. Стилістика-граматичні особливості англійського тексту. Особливості використання інформаційних технологій при перекладі науково-технічних текстів.
курсовая работа [103,8 K], добавлен 29.05.2014Модальність як функціонально-семантична категорія. Концептуальні підходи до визначення поняття модальності у лінгвістиці. Класифікація видів модальності. Засоби вираження модальності при перекладі текстів різних жанрів з англійської мови на українську.
курсовая работа [133,0 K], добавлен 22.12.2010Теоретичні засади дослідження компресії як лінгвістичного явища при перекладі публіцистичного тексту. Механізм стиснення тексту на синтаксичному рівні. Єдність компресії та декомпресії під час перекладу газетних текстів з англійської мови українською.
курсовая работа [63,8 K], добавлен 21.06.2013Загальна характеристика ідіом, їх місце в сучасній системі фразеологічних одиниць мови. Особливості, види, типи, форми, методи та практичні аспекти перекладу художнього тексту. Аналіз перекладу мовних конструкцій та ідіоматичних одиниць в художніх творах.
дипломная работа [137,2 K], добавлен 13.09.2010Розгляд фонових знань необхідних для перекладу текстів в галузі психології. Ознайомлення з положеннями перекладу та визначення особливостей перекладу текстів науково-технічної літератури. Систематизація і класифікація труднощів з метою їхнього подолання.
курсовая работа [67,5 K], добавлен 26.02.2012Визначення поняття синтаксичної трансформації як особливого виду міжмовного перетворення та невід’ємної частини процесу перекладу. Характеристика основних типів синтаксичних трансформацій та аналіз їх використання під час перекладу різних текстів.
статья [24,1 K], добавлен 24.11.2017Мовна культура, характерні риси ділового стиля. Використання мовних кліше у ділових паперах, їх основні ознаки та перетворення у мовні штампи. Просторіччя та вульгаризми в канцелярській мові. Типові помилки використання кліше в сучасних рекламних текстах.
курсовая работа [41,7 K], добавлен 22.03.2014Дослідження теорії антропоцентризму в когнітивній та комунікативній лінгвістиці. Особливості дискурсів із висловлюваннями відмови в англійській та німецькій мовах. Аналіз заголовків, які сигналізують про антропоцентричну тональність прозових текстів.
курсовая работа [45,5 K], добавлен 13.10.2012


