шпаргалка

Контент-анализ как качественно-количественный метод анализа документов.

[ Назад ]
Контент-анализ от англ. content analisis – анализ содержания определений много.
Г.М. Андреева. Выделения в тексте документа некоторых ключевых понятий (или иных смысловых единиц) с последующим подсчетом частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации.
В.А. Ядов. Перевод в количественные показатели массовой текстовой (или замененной на пленку) информации с последующей статистической её обработкой.
Контен-анализ метод количественно-качественного анализа документов, используется в различных социальных исследованиях.
Специфика метода – подсчет частоты и объема упоминаний тех или иных единиц исследуемого текста. Результаты количественные дают возможность сделать выводы о качественном, в том числе латентном (не явном) содержании текста.
Правомерность использования – текст продукт человеческой деятельности. Он несет в себе следы влияния разнообразных социально-психологических факторов …. возможно обнаружить и измерить эти факторы путем регистрации в тексте соответствующих индикаторов.
Главная сложность – нахождения таких процедур, при помощи которого можно было бы обнаружить в тексте соответствующие индикаторы исследуемых явлений и характеристик, замерить их и затем адекватно интерпретировать.
Для этого текста применяются следующие процедуры (исходя из конкретного текста и задач исследования):
1. сформировать ключевые, концептуальные понятия исследования, которого принято называть категориями контент-анализа.
2. надежно и систематически зафиксировать частоту и объем упоминания этих категорий в отдельных элементах текста и во всей совокупности текстов анализируемых документов.
Полученные данные подвергают статистические обработки и результаты интерпретируются в соответствии с целями исследования.
Один из наиболее разработанных и строгих методов (формализованных) анализа документов. Широко распространен не только в психологии (особенно в социальной психологии, политической психологии, психологии рекламы, психологии массовой коммуникации и психодиагностике), но и в других социальных науках. Например: в социологии, политологии.
Зародился в 20-е годы в американской журналистике или средство количественно-качественного изучения содержания прессы. Основные процедуры метода разработаны американскими социологами Х. Лассуэлом и Б. Берельсоном (монография «Контент-анализ в коммуникационных исследованиях») в 20-е годы 20 столетия.
В отечественной психологии в 20-30 гг. были выполнены исследования на основе процедур, аналогичных контент-анализу (В.А. Кузьмичев, Н. А. Рыбников, И.Н. Шпильрейта и др.).
В 60-е годы отчественные социологи и психологи вновь обратились к контент-аналитическим исследованиям (А.В. Баранов, В.З. Кочан, Ю.И. Скворцов).
В последние годы контент-анализ приобрел «второе дыхание» в связи с развитием психосемантики, методов многомерного анализа данных и применения ЭВМ для исследования больших массивов информации. Значительно расширилась тематика контен-аналитических исследований:
 изучают содержания сообщений о психологических особенностях типов личностей, их интересов, ценностных ориентациях;
 анализируют социально-психологические явления и процессы в группах;
 изучают содержание сообщений о психологических основах обучения и воспитания, воздействие на количественное мнение, настроения и традиции.
Происхождение контен-анализа связано с исследованиями в области массовой коммуникации. Именно в массовой коммуникации наиболее четко выражены основные условия, без соблюдения которых применение контент-анализа целесообразно:
1. изучаемые качественные характеристики, в том числе социально-психологические, должны носить однопорядковый характер и проявляться в тексте с достаточной частотой.
2. изучаемого текстового материала должно быть столь много, что его невозможно охватить без суммарных оценок, особенно когда он носит несистематизированный характер.

Требования.
По сути, контент-анализ предполагает перевод качественно представленной информации на… отчета … надо
1) иметь достаточно объемный и содержательно болльшой текст, который невозможно проанализировать без контент-анализа.
2) Обладать определенным уровнем исследовательской подготовки, чтобы реализовать данные метода.
3) Характеристики должны быть однорядного характера и достаточно часто повторятся в тексте.
В современной психологической практике контен-анализ находит свое применение в трех разновидностях:
1) в качестве основного метода исследований
2) как составная часть используемого комплекса исследовательских методов
3) в виде вспомогательной процедуры обработки данных, полученных иными эмпирическими способами.
При анализе результатов проективных тестов, беседы, анкетирования, фокус-групп.
Контен-анализ может использоваться как самостоятельный метод (например: в исследовании социальных установок читательской аудитории опр. органа массовой коммуникации) Чаще и более плодотворно используют в сочетании с другими методами, например: опрос, наблюдения и т.д.
Специфика применения: В каждом случае в очень большей степени определяется целью и теоретической основой исследования; как ни один другой метод в социальной психологии.
Это объясняется тем, что основные понятия, вытекающие из цели и теоретической основы исследования, одновременно являются и категориями контент-анализа, с которым соотносят отдельные элементы текста и статистически обрабатывают выявленные соотношения.
Главная задача, решается посредством контент-анализа – выявить связь текста с некоторой «внетекстовой реальностью», так или иначе продуцирующей этот текст.
Под «внетекстовой реальностью» поняимаются не только реальные события, факты, отношения, о которых идет речь в тексте, но и настроения, чувства, установки, позиции, интересы и другие социально-психологические характеристики коммуникатора, реципиента и сам процесс коммуникации, а также социально-психологические феномены групповой активности.

Достоинства.
 возможность точной регистрации внешне неразличимых показателей в объемных массивах данных;
 возможность выявления скрытых тенденций и закономерностей;
 нет эффекта воздействия исследователя на поведение испытуемых;
 данные проверены на надежность;
 можно рекомендовать для анализа исторических документов (анализ прошлых событий и ситуаций, относительная объективность процедур и надежность результатов).

Ограничения.
Громоздкая процедура – трудоемкость.
Характер информации во многом определяется замыслами её автора и спецификой предъявления форм.

Искажения.
Исследователь может принять вымысел за документальность.
Упустить существенные данные из-за недостаточной выраженности их в материале.
Неадекватность выделенных категорий анализа.
Не учесть всех имеющихся вариантов их словесного выражения.
Далеко не всякий материал поддается необходимой формализации.
Например: применим ли метод к описанию поведения лирического героя поэмы.

Основные процедуры контент-анализа
Основные этапы:
1. Подготовительный. Разработка программы анализа материала. Он включает постановку цели исследования, (или формулировку её в соответствии с интересами заказчика) предварительный анализ массивадокументальной информации на предмет надежности, адекватности избранного метода.
Разрабатываются категории и единицы анализа. Составляется классификатор – опросная схема для контент-анализа. Перечень категорий анализа, соответствующего им индикаторов, принятых единиц счета. Это основа алгоритма последующих действий. От качества классификатора зависит эффективности всей работы.

Характеристиками или элементами содержания, по отношению и которым применяется процедура подсчета, могут быть отдельные слова, словосочетания, предложения, абзацы, тексты.
При этом сами характеристики (например: упоминание имени политика) никогда не являются самоцелью. Они интересны лишь в той степени, в какой являются индикаторами происходящего во внеязыковой реальности (например: сравнения нескольких отслеживания по времени и сопоставления с поступками популярность одного политика … что привлекает внимание).
Каждая категория дифференцируется на единицы анализа – индикаторы, признаки выраженности категории.
Они представляют собой части текста, характеризуется принадлежностью к определенной категории.
Стандартные единицы: 1) слово (термин, символ). 2) суждения или законченная мысль. 3) тема. 4) персонаж. 5) автор. 6) целостное сообщение.
Каждая единица рассматривается в контексте более общей структуры.
В зависимости от цели выбираете единицы анализа: символы, слова, сочетания слов разной протяженности, ситуации, реплики, интонации (при анализе устных сообщений).
Это единицы, которые конкретизируют категорию, принадлежат ей, отражают часть её содержания.
Например: характер отношения к себе. Я себя люблю - суждение
Мне часто не везет -
Я спокойный 0
Я горжусь своими успехами +
Процедурные этапы:
I этап. Определения задач, теоретические основы и объекта исследования, разработка категориального анализа, выбор соответствующих качественных и количественных единиц контент-анализа.
Связан с составлением программы исследования. Он носит характер качественного анализа, который подготавливает перевод смыслового содержания текста в цифровое выражение для его последующего количественного анализа.
а) Выбор объекта исследования
При контен-анализе документов, специально составленных для целей исследования (например: текстов ответов на открытые анкеты, тексты интервью и т.д.) анализируются обычно все данные документы. Если же речь идет о документах, независимых от исследователя, Например: тексты газет, журналов и т.д., то возникает необходимость в выборке. Построения выборки по признакам организации социально-психологическому исследованию. Выбирается орган массовой коммуникации, номера за определенные периоды времени и типы сообщений, Например: рубрики, типы публикации и т.д.)
б) Единицы контент-анализа делятся на 2 группы.
1. Качественные (смысловые) к ним относят категории и их индикаторы в тексте. Они отвечают на вопрос что надо считать в тексте.
2. Количественные отвечают на вопрос как надо считать.

Шалак В.И.
Современный контен-анализ.
Приложения в области: политологии,
психологии, социологии, культурологии,
экономики, рекламы. М., 2004

«Контент-анализ – это методика выявления частоты появления в тексте определенных, интересующих исследователя характеристики, которые позволяет ему делать некоторые выводы относительно намерений создателя этого текста или возможных реакций адресата» (Федотова Л.Н. Анализ содержания социологический метод изучения средств массовой коммуникации. М., РАН, 2001)

Элементы содержания являются частным случаем категории. Категория – это множество единиц анализа, объединяющего вместе по тому или иному признаку. Например: Жилье – берлога, дом, жилище, обитель, логово.
Агрессивность – бить, назло, рычать, бушевать, погром.
Глаголы прошедшего времени – взяла, приказал, ждали, уехали и т.д. Частота упоминания в тексте некоторой категории подсчитывается как измена частот, входящих в неё элементов.
Категории анализа – это ключевые элементы, смысловые единицы, выраженность, которая подлежит регистрации в соответствии с целью исследования.
Список категорий должен быть предельно исчерпывающим, он должен давать возможность однозначного соотнесения той или иной части текста с конкретной категорией.
Смысловые единицы могут быть самыми разными – проблема, тема, идея, оценка и т.д. все зависит от цели исследования и самого материала.
Например: Изучали характер человека по результатам анкетирования или интервью.
Следующие категории: отношение к себе, к другим, к деятельности, в вещам (предметам), к природе.
Изучаем тревожность.
Темы: беспокойство по поводу здоровья, семьи, карьеры, финансов и т.д.
Нужно учитывать, что категории могут быть представлены различными по знаку единицами анализа (+, –, 0, - амбивалентными), что одна и та же категория бывает, выражена в тексте по-разному: от отдельных слов до законченных предложений или абзацев. Потому выделить единицы анализа непросто.
При проведении контент-анализа в зависимости от сложности цели исследования либо единицы анализа равна эмпирическим индикаторам либо составляют подтемы смысловых единиц. Например: Цель свойства личности
категории: характер, темперамент, коммуникативные свойства.
Единицы анализа по 1 категории: характер, отношения к себе, другим и т.д. Например: единица анализа негативная оценка определяется по эмпирическим индикаторам словами «плохо», «безобразие», «отвратительный» и т.д.
Категории, единицы анализа – это качественные характеристики. Однако контент-анализ является качественно-количественным методом.
Единицы счета – это количественные характеристики отношений категорий друг к другу или единиц анализа и категориям.
Два варианта их использования:
1) Частоту проявлений в тексте категории или её признака.
2) Пропорция представленности категорий или признака – объем внимания, уделяемый ей автором текста.
Считаем единицы анализа, сумму по категории, сравниваем категории между собой. Объем информации примеряется разными единицами счета в зависимости от вида документов и задач это могут быть: строки газетных полос, площадь частей текста, квадратные сантиметры, квадратные метры, проценты, при изучении средств наглядной агитации, минут эфирного времени, и т.д.
Сравнительное количество печатных знаков.
Часто одновременно подсчитывается как частота, так и объем упоминания выделенных единиц анализа.
Разработка классификатора завершается составлением инструкций кодировщику и подготовкой кодировочной матрицы.
Инструкции содержат предельно четкие указания на то, каковы все выделенные категории, какой набор признаков в тексте соответствует каждой из них, какого типа единицы счета при этом используются. Объективность результатов будет выше, если исследователь письменно сформулирует инструкции даже в том случае, когда сам будет кодировщиком.
Кодировочная матрица – таблица, удобная для регистрации первичных результатов.
По вертикали – категории анализа, а по горизонтали – единицы анализа с цифрами частот.
Завершает подготовительный этап – пилотажное исследование. Оно помогает найти недостающие категории, единицы анализа, скорректировать инструкцию. Если массив большой, а выяснили, что примерно распределены темы одинаково, то выборочные исследования.
2. Исполнительный этап – совокупность процедур по выделению индикаторов категорий и регистрации характеристик их присутствия в тексте.

Ошибки: неверное соотнесение единиц анализа с категориями
пропуск тех или иных единиц анализа
фиксация того, что нет на самом деле.
Устойчивость результатов падает.
Причины:
качество инструкций, неумелость кодировщиков, неподходящая обстановка работы,
отсутствие внимательности, или добросовестности.
3. Этапы обработки данных.
Содержание его определяется целью исследования.
1) Простейший способ – регистрация частоты появления тех или иных единиц в тексте, частотные ил процентные распределения.
Сопоставления частоты появления единиц в разных текстах, изменения от начала сообщения до его завершения и т.д. Сопоставительные таблицы.
В.И. Шлак
Простые частоты нельзя применить, если мы захотим сравнить разные по длине тексты. Например: категория «негатив» встречается с частотой 20 слов в тексте длиной 1000 слов и в другом тексте – с частотой 100 с длиной текста 10000 слов. Можно ли утверждать, что второй текст более негативно окрашен чем первый? Нет.
Для сравнения нужно сопоставить условные частоты или условные доли, которая составляет категория «негатив» в первом и втором тексте.

Условная частота = частота категории
длина текста
При этом в качестве длины текста принимается сумма элементов содержания вообще. Например: Сумма слов, предложений, абзацев.

Например: ус.ч1 = 20 = 0,02 ус.ч2 = 100 = 0,01 …. более негативно
1000 10000
окрашен первый текст.
Более удобнее использовать вместо условных частот оценку процентов содержания. Для этого умножают условную частоту на 100.
2) Построение матриц совместных появлений единиц контент-анализа в текстах.
Регистрируются частоты независимой встречаемости единиц А и В в разных сообщениях.
Вычленяется условная (теоретическая) вероятность совместной встречаемости, равные Р (АВ) = Р (А) * Р (В)
Регистрируется частота совместного появления этих единиц в одном сообщении.
Сравниваем эмпирическую частоту (реальную) с теоретической направленности информация о случайности их появления вместе
если ФАВ < РАВ
не случайности если ФАВ > РАВ
Выявление случайных и неслучайных зависимостей элементов содержания метод Ч. Осгуда.
Например: Монологи радиокоментатора
ассоциативная взаимосвязь понятий
модель и болезненные проявления.
Суть метода: сначала расчитать теоретическую вероятность встречаемости 2 единиц анализа, а затем сравнить её с реальной величиной фактической встречаемости этих единиц (которая была заранее три…)
формуле Р (АВ) = Р (А) * Р (В)
А – встречается в 20% текстов = 0,2
В – в 30% текстов = 0,3
Р (АВ) = 0,06 или = 6%
Фактически совместно встречались
Ф (АВ) = 0,02 или = 2%
Зависимость единиц анализа случайна
3) Расчет коэффициента Яниса – для установления соотношения + и – оценок относительно определенных категорий
С = fn – n2 , для случая, когда f < n
r t
C = f2 – fn , для случая, когда f > n
r t
f – число + оценок
n – число – оценок
r – объем единиц информации, отражающих изучаемую категорию
t – общий объем единиц анализируемого текста.
4) Коэффициенты корреляции, факторный анализ

КАТЕГОРИИ:

Network | английский | архитектура эвм | астрономия | аудит | биология | вычислительная математика | география | Гражданское право | демография | дискретная математика | законодательство | история | квантовая физика | компиляторы | КСЕ - Концепция современного естествознания | культурология | линейная алгебра | литература | математическая статистика | математический анализ | Международный стандарт финансовой отчетности МСФО | менеджмент | метрология | механика | немецкий | неорганическая химия | ОБЖ | общая физика | операционные системы | оптимизация в сапр | органическая химия | педагогика | политология | правоведение | прочие дисциплины | психология (методы) | радиоэлектроника | религия | русский | сертификация | сопромат | социология | теория вероятностей | управление в технических системах | физкультура | философия | фотография | французский | школьная математика | экология | экономика | экономика (словарь) | язык Assembler | язык Basic, VB | язык Pascal | язык Си, Си++ |