Векторні представлення слів для української мови
Векторні представлення як основний спосіб подання слів у сучасних системах опрацювання природної мови. Сучасні підходи до таких обчислень з використанням нейронних мереж на прикладі word2vec. Перелік реалізацій методів та алгоритмів для побудови.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | украинский |
Дата добавления | 16.05.2020 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Отже, важливо продовжувати й розвивати дослідження, які стосуються побудови векторних представлень слів на основі всіх відомих моделей, та звернути увагу на актуальні завдання в цій галузіSebastian Ruder, “Word embeddings in 2017: Trends and future directions”, переглянуто 01.04.2018, http://ruder.io/word-embeddings-2017.:
Відсутність теоретичних досліджень у галузі векторних представлень слів зумовлює нагальну потребу в їхньому проведенні. Успішне використання моделі '№0^2уєс не зменшує потребу в теоретичних дослідженнях явищ, які спостерігаються у векторних просторах слів, і автору не відомі такі роботи для української мови.
Оцінка отриманих векторних представлень слів потребує подальшого розвитку. Потрібно шукати баланс між якістю та затратами на оцінку векторів слів на основі відомих методів та працювати над створенням нових.
Потрібно розробляти методи для адаптації готових векторних представлень слів до спеціялізованих доменів, для яких відсутні корпуси необхідного обсягу, що дозволить отримати спеціялізовані векторні представлення. Розв'язувати це завдання можна також додаванням до готових векторних представлень семантичної інформації для їхнього використання в певному домені;
Пошук методів виявлення та усунення упереджень та стереотипів (наприклад, ґендерних), яких набувають вектори слів за їхньої побудови.
Пошук ефективних способів додавання символьної інформації до вже побудованих векторів слів. Така потреба виникає під час застосування векторних представлень для морфологічного аналізу, видобування іменованих сутностей, синтаксичного аналізу й машинного перекладання.
Розвиток методів побудови векторів для слів, відсутніх у корпусі текстів, на ґрунті якого здійснюється тренування. Підходи на основі моделі БазїТехї: можуть отримати розвиток для розв'язання цього завдання.
Розвиток способів побудови векторів слів, які мають кілька значень, або теоретичне та практичне доведення, що готові векторні представлення не потребують вирішення цього завдання.
Пошук ефективних способів побудови векторних представлень для висловів та багатослівних конструкцій, значення яких можна розглядати і як поєднання значень слів, з яких вони складаються, і як зовсім інше значення.
Розроблення методів для врахування діяхронічної природи слів, оскільки значення слів та їхнє використання з часом змінюються.
Розвиток багатомовних векторних представлень слів та їхнє ефективне використання подібне до подібне до запропонованого в праці Алексіса
Конно зі співавторамиA. Conneau, et al., “Word Translation Without Parallel Data”, arXiv:1710.04087v3. для роботи з мовами, для яких не створені корпуси необхідного обсягу.
Розроблення способів збільшення типів контекстних даних, на основі яких будуються векторні представлення. Такими контекстними даними можуть бути синтаксичні структури речення, інформація з різноманітних словників та інших джерел структурованих даних.
Размещено на Allbest.ru
Подобные документы
Давня та сучасна українська лексикографія. Поняття словника. Орфографічний словник української мови. Тлумачний словник української мови. Словник синонімів української мови. Винекнення лексикографії з практичних потреб пояснення незрозумілих слів.
реферат [33,0 K], добавлен 25.01.2009Поняття архаїзми, напрямки дослідження архаїзмів в лексикографі. Тематичнi групи архаїзмiв, значення слiв архаїзмiв у тлумачному словнику української мови А. Iвченка. Співвідношення архаїчного значення слів, особливості створення сучасних словників.
реферат [33,1 K], добавлен 16.08.2010Вигук та звуконаслідування як частини української мови, відвигукові одиниці: поняття, особливості, класифікація. Структурно-семантичний зміст та функціональна характеристика вигуків і ономатопоетичних слів. Стилістичне використання вигукової лексики.
курсовая работа [92,4 K], добавлен 18.09.2014Дослідження складних слів у мовознавстві. Визначення композитів та юкстапозитів. Словоскладання в мовних терміносистемах. Закономірності побудови складних слів українського походження в творах Ліни Костенко. Семантична класифікація одноструктурних слів.
дипломная работа [100,4 K], добавлен 03.10.2014Зміст слів іншомовного походження із обраного фаху. Відокремлення із величезної кількості слів іншомовного походження терміносистеми економічного змісту дає можливість студентам-економістам працювати з ними під час занять із "Української ділової мови".
методичка [61,2 K], добавлен 08.03.2009Характерні риси сучасної української літературної мови та особливості її використання. Історія становлення української графіки й орфографії, видання "Українського правопису" 1945 р. Походження іноземних слів, що використовуються в літературній мові.
реферат [24,7 K], добавлен 04.07.2009Закріплення державної мови традицією або законодавством. Українська мова - мова корінного населення України. Поширення викладання мови в навчальних закладах. Розвиток літературної мови за рахунок повернення вилучених слів та слів регіонального походження.
контрольная работа [20,8 K], добавлен 10.12.2011Формування словникового складу японської мови. Види іншомовних запозичень, "васейейго" як феномен лексики. Відсоток запозичених слів в лексиці японської мови, популярність в її лексичному складі англійських слів на сучасному етапі, обґрунтування.
курсовая работа [48,6 K], добавлен 02.10.2014Лексико-семантична характеристика та стилістичне використання вигукової лексики. Поняття та структурно-семантичні особливості ономатопоетичних слів та їх функціонально-стилістичний аспект. Класифікація вигуків та звуконаслідувальних слів української мови.
курсовая работа [51,1 K], добавлен 03.10.2014Місце фразеологізмів в мовній картині світу. Способи відображення семантичних, прагматичних і культурологічних особливостей у лексикографічному портреті фразеологічних оборотів англійської та української мови, що не мають відповідностей в системі слів.
дипломная работа [102,7 K], добавлен 17.08.2011