Виявлення ключових понять з тексту за допомогою контент-аналізу

Текст аналізованого документа - продукт діяльності людини. Контент-аналіз - якісно-кількісний метод вивчення документів, що визначається об’єктивністю висновків та полягає в квантифікаційному обробленні тексту з подальшою інтерпретацією результатів.

Рубрика Журналистика, издательское дело и СМИ
Вид статья
Язык украинский
Дата добавления 05.02.2019
Размер файла 149,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Багатозадачність контент-аналізу вражає: кількісний і якісний аналіз текстів, визначення тематичного спрямування, оптимізація пошукових запитів, аналіз контенту сайтів для успішного їх просування, визначення плагіату, різні соціологічні дослідження, аналіз засобів масової інформації. Контент-аналіз може визначити досьє на автора книги або статті (його профорієнтація, психологічний портрет, стиль письма) і зворотну задачу: написання книг або статей в стилі потрібного автора, якщо слід за когось написати.

Наведемо лише деякі визначення контент-аналізу з [1; 2].

Контент-аналіз це методика об'єктивного якісного і систематичного вивчення змісту засобів комунікації (Д. Джері, Дж. Джері).

Контент-аналіз це систематичне числове оброблення, оцінка та інтерпретація форми та змісту інформаційного джерела (Д. Мангейм, Р. Річ).

Контент-аналіз це якісно-кількісний метод вивчення документів, який характеризується об'єктивністю висновків і суворістю процедури та полягає в квантифікаційному обробленні тексту з подальшою інтерпретацією результатів (В. Іванов).

Контент-аналіз полягає у знаходженні в тексті певних змістовних понять (одиниць аналізу), виявленні частоти їх вживаності та співвідношення з вмістом всього документа (Б. Краснов).

Контент-аналіз це дослідницька техніка для отримання результатів шляхом аналізу змісту тексту про стан і властивості соціальної дійсності (Є. Таршис).

Одним з важливих завдань контент-аналізу є виявлення понять з тексту. Тому метою нашої статті є визначення спектру понять на прикладі поняття «контент-аналіз».

Однозначне трактування понять необхідне перш за все в технічних системах. Поняття ж контент-аналізу, що має корені в психології та соціології, на сьогодні поки що не має однозначного визначення. Це породжує низку проблем, найважливіша з яких полягає в тому, що програмні системи, побудовані на основі різних підходів до контент-аналізу, несумісні [1].

Кожне визначення контент-аналізу відображає напрямок його дослідження, завдання і є можливістю виявити сенс, загальні та унікальні ключові слова, що властиві конкретному методу дослідження, джерелам та досліджуваним об'єктам.

Як видно з перерахованих вище прикладів, визначення складають невеликі обсяги тексту з закінченою думкою [4].

Правомірність використання контент-аналізу в різних соціальних дослідженнях визначається тим, що текст аналізованого документа є продуктом діяльності людини. Тому він відображає вплив різноманітних соціальних і психологічних факторів. Звідси виникає можливість виявлення і вимірювання цих факторів шляхом реєстрації в тексті їх відповідних індикаторів або референтів. Таким чином, метою контент-аналізу є осягнення більш глибокої позатекстової реальності, тобто на основі такого аналізу ми робимо висновки про реальність історичної події або явища [5, с.19].

Практично всі основні визначення поняття «контент-аналіз» надано у працях В.В. Осіна [1, с. 574-596] і В.М. Звєрєва [2, с. 119-141]. На думку англійського вченого кінця XIX ст. У. Кельвіна: «якщо ви в змозі виміряти і виразити, про що ви говорите в числах, то ви дещо про це знаєте, але якщо ви не можете виміряти це і виразити в числах, Ваші знання мізерні і незадовільні» [6]. Існує і більш загальне висловлювання: «в кожній науці стільки науки, скільки в ній математики».

Для дослідження автоматично знайдено близько ста визначень [1; 2]. За визначення вважається абзац або речення обсягом більше ста знаків, де згадується про контент-аналіз, зі структурою «контент-аналіз це ...».

Кожне окреме визначення контент-аналізу порівнюється з іншими за частотним складом з підрахунком коефіцієнта тематичного спрямування (КТН) за допомогою програми «Аналіз текстів». При цьому поповнюється словник стоп-слів і словник лексимів до тих пір, поки кількість слів масиву унікальних слів кожного файлу не перевищує п'яти.

контент аналіз документ

Рис. 1

Показання коефіцієнта тематичного спрямування та номер визначення поняття «контент-аналізу» заносимо в таблицю (табл. 1):

Будуємо графік зміни КТН, упорядкувавши другий стовпчик табл. 1 КТН за зменшенням.

Помітивши лінійний характер кривої зміни показника КТН, додамо лінію тренда лінійного характеру з рівнянням.

Табл. 1

№ визначення

КТН

1

0,593182727546343

2

0,578939268964588

3

0,56777890672908

101

0,709023059726348

Отже, якщо в текстах досліджується яке-небудь поняття, то графік КТН за зменшенням буде виглядати як пряма лінія (в ідеалі). Чим крутіше нахил прямої, тим ширше поняття. Наявність на графіку КТН спотворень типу «сходинка» свідчить про надмірність кількості знайдених в тексті визначень: визначені поняття з однаковими значеннями КТН можуть бути виключені з аналізу поняття.

Так, замість чотирьох значень КТН доцільно залишити одне, наприклад: A (0,86168).

Рис. 2

Розглянемо ділянку значень КТН (0,8-0,9) фрагмент графіка КТН на рис. 3:

Рис. 3

Проаналізуємо вибрані визначення: оскільки ділянка 0,8-0,9 обрана ліворуч високі значення коефіцієнта тематичного спрямування, то й отримаємо найбільш загальне визначення досліджуваного поняття «контент-аналіз»:

Табл. 2

Точка/файл

Значення КТН

Визначення

Д097.txt

0,83963421325756

контент-аналіз це опис й інтерпретація значень спостережуваної соціальної поведінки"". Виходячи з того, як мало контент-аналітичних досліджень в Україні, бракує знань у галузі контент-аналізу й українським дослідникам

Е096.txt

0,814635363464398

контент-аналіз є одним з класичних методів вивчення документів і пише, що "стосовно текстів можна робити лише чи головним чином якісний аналіз" . Зрозуміло, що таке тверджен ня суперечить дійсності, його розбиває весь історичний досвід контент-аналізу. Не всі, навіть американські (тобто представники батьківщини контент-аналізу), дослідники розібралися у тому, що ж таке контент-аналіз

G089.txt

0,79428724678285

Частина обмежує об'єкт контент-аналізу суто журналістськими текстами, причому завдання дослідження фактично збігається з класичним визначенням комунікаційного ланцюжка Г. Лассвелла. Наприклад, деякі московські дослідники вважають, що кількісно-якісний аналіз (контентаналіз)... може переслідувати різні завдання: наскільки адекватно відображено у них (журналістських матеріалах. В. І.) зміст дійсності; якою мірою реалізуються завдання видавця...

Точки перетину кривої розподілу КТН з лінією тренда лінійного розподілу дозволять знайти найбільш змістовні визначення поняття «юнтент-аналіз» для подальшого аналізу. Дані занесемо в таблицю (табл. 2):

рефлексивний аналіз документів вільне зібрання вимірювань кількісні дані про зміст тексту інтерпретація значень кількісно-якісний аналіз

Отриманий результат очевидний. Однак він отриманий шляхом обчислення, а не міркування.

Якщо взяти значення з центру графіка КТН (значення 0,6-0,7), отримаємо визначення:

Проаналізуємо вибрані визначення: A1, B1, C1, D1, які обрані у центрі кривої розподілу КТН (рис. 4), значення коефіцієнта тематичного спрямування (0,6 0,7) і отримаємо визначення досліджуваного поняття «контент-аналіз» (табл. 3):

Табл. 3

Точка/файл

Значення КТН

Визначення

А1101.txt

0,709023059726348

Контент аналіз дослідження як наявного, так і прихованого змісту комунікацій. Звичайно, в останньому випадку потрібні особливі процедури для підвищення достовірності й валідності висновків дослідження. Співвідношення якісних і кількісних начал у конвент-налізі дозволяє досягти великого ступеня надійності й валідності

B1098.txt

0,698786162352785

контент-аналіз це майже єдиний метод, у якому переважають квантифікаційні процедури. Він вигідно відрізняється від інших методів своєю об'єктивністю й систематичністю

C1050.txt

0,659889688190607

Данные, полученные из архивных записей и документов, могут быть систематически проанализированы при помощи метода контент-анализа. М ожно анализировать содержание писем, дневников, газетных статей, протоколов собраний и тому подобное. ^нтент-анализ является как методом анализа данных, так и методом наблюдения. Вместо непосредственного наблюдения за поведением людей или вопросов о нем, исследователь берет коммуникации, произведенные людьми, и задает вопросы коммуникации. Содержание коммуникации служит основой для выводов

Д1028.txt

0,633120959270858

Контент-анализ является систематическим методом исследования сообщения или содержания печатных медиа для получения выводов о коммуникационной системе

Рис. 4

Отже, контент-аналіз це дослідження змісту з метою виявлення явних або неявних аспектів змісту, розподілу за категоріями, отримання висновків тощо.

Вищевикладена методика дозволяє виявити й інші аспекти поняття «контент-аналіз», вибравши ділянку правіше або задати інтервал значень КТН. Слід враховувати, що чим менше КТН, тим специфічніші властивості досліджуваного поняття.

Лінійний характер КТН може бути використаний як критерій надмірності кількості дослідних інформаційних одиниць: наявність на графіку КТН спотворень типу «сходинка».

Отже, ми визначили поняття «контент-аналіз» для різних предметних областей. Поняття контент-аналізу залежить від цілей дослідника. Для більш загальних випадків (великі значення КТН 0,8-0,9) це кількісний аналіз для загальної систематизації або загальних висновків. Для випадків з середніми значеннями КТН (0,6-0,7) це дослідження змісту для специфічних цілей. Ця методика інваріантна для будь-яких понять.

Література

1. Осин В.В. Процессы конституирования и воспроизводства в науке: исследование вариаций контент-анализа: монография / В.В. Осин. Д.: Лира ЛТД, 2007. 636 с.

2. Зверев В.М. Социологическое прочтение философских идей России XVIII века: контент-анализ. СПб: Изд-во Рус. христиан. гуманит. ин-та, 1998. 159 с.

3. Ландэ Д., Литвин А. «Феномены современных информационных потоков» / [Электронный ресурс]. Режим доступа: http://www.visti.net/~dwl/art/content/, Информационный центр «ЭЛВИСТИ».

4. Кузнецов О.Ю. Технологія інформометричних досліджень матеріалів конференцій (на прикладі конференцій «Крим-2005» і «Крим-2010») / [Електронний ресурс] // Міжнародна наук. конф. «Формування і розвиток бібліотечного електронного середовища»: матеріали конф. (Київ, Україна 3-6 жовтня 2011 року). Режим доступу: archive.nbuv.gov.ua/new/11_Kiev/ kuznetsov_o.ppt

5. Богомолова Н.Н. Контент-анализ / Н.Н. Богомолова. М.: Изд-во Моск. ун-та, 1992. 60 с.

6. Миронов Б.Н. История в цифрах: математика в исторических исследованиях/ Б.Н. Миронов. Ленинград: Наука, 1991. 168 с.

Размещено на Allbest.ru


Подобные документы

  • Документальные источники информации, их достоверность. Приемы качественно-количественного анализа документов. Контент-анализ как метод анализа документов. Оценка метода документального анализа. Надежность информации полученной с помощью контент-анализа.

    курсовая работа [32,9 K], добавлен 13.05.2009

  • Зображення, зображальна діяльність і зображальна журналістика, як соціокультурні феномени і категорії журналістикознавства. Архітектоніка та контент журнального видання в системі наукових знань. Єдність шрифтових, пробільних, декоративних елементів.

    дипломная работа [121,6 K], добавлен 17.06.2014

  • Контент-анализ как метод изучения корпоративной прессы. Содержательная модель корпоративного издания. Особенности журнал "Ростелеком", его формат и содержание, разделы и рубрикации, тематика, жанровое наполнение. Соотношение материалов в издании.

    курсовая работа [40,5 K], добавлен 01.06.2014

  • Тематическая направленность материалов. Жанр, вид, форма и характер публикации. Локальность и герой материала. Вид кодификатора контент-анализа. Кодировочные карточки разных выпусков анализируемой газеты. Общая площадь газеты, журналистские материалы.

    практическая работа [83,0 K], добавлен 13.06.2012

  • Проведение контент-анализа газеты и подведение итогов по вопросу попоулярности представленной газеты среди местных газет Ростова. Форма подачи материала, достижение газетой конкурентных преимуществ перед другими изданиями. Локальность подборки статей.

    реферат [68,3 K], добавлен 18.02.2010

  • Аналіз змісту сучасних зарубіжних бібліотекознавчих журналів. Висвітлення результатів контент-аналізу журналів європейських країн: Великобританії, Нідерландів, Німеччини та Франції. Визначення наукових тенденцій бібліотечної галузі на основі публікацій.

    статья [78,1 K], добавлен 18.12.2017

  • Редагування як синтез операцій контролю та виправлення, приведення тексту у відповідність із нормами. Опис норм редагування, методи контролю й виправлення помилок. Етапи опрацювання тексту. Методи комп’ютеризації процесу редагування, його нормативна база.

    курс лекций [262,8 K], добавлен 11.01.2010

  • Дослідження медіа тексту у контексті багатоманітності наукових підходів. Медіалінгвістика в сучасній Україні: аналіз ситуації. Особливості семантико-функціонального призначення перифразів у публіцистиці. Газетний текст в медіалінгвістичному дискурсі.

    статья [26,2 K], добавлен 27.08.2017

  • Визначення понять полеміки, дискусії, диспуту. Характеристика найбільш ефективних полемічних прийомів. Особливості втілення полемічного тексту в ток-шоу і друкованих ЗМІ. Конкретизація форм аргументації та аргументативних помилок в полемічних публікаціях.

    курсовая работа [35,8 K], добавлен 18.12.2011

  • Контент-анализ доминирования в российских средствах массовой информации тем, касающихся агрессии, насилия и жестокости. Анализ структурно-семиотических, понятийно-тематических и концептуальных единиц периодических изданий "Коммерсантъ" и "Газета".

    лабораторная работа [2,2 M], добавлен 09.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.