Поиск публикаций  |  Научные конференции и семинары  |  Новости науки  |  Научная сеть
Новости науки - Комментарии ученых и экспертов, мнения, научные блоги
Реклама на проекте

Когнитометрия 2

Воскресенье, 04 Ноябрь, 19:11, ivanov-petrov.livejournal.com



3. История названия
Метод предложено было называть «методом когнитивных схем», «методом карт концептов». Имеется большое количество методов со сходными названиями, имеющими с предложенным методом мало общего. В целом это – очень обширное направление Mind Maps (Mеmory Maps и т.п. http://www.compress.ru/article.aspx?id=17383&iid=805 http://www.effecton.ru/265.html http://www.aiportal.ru/articles/knowledge-models/semantic-network.html). Общим у всех методов этого направления является то, что на какой-то стадии все рисуют блок-схемы, квадратики и кружочки со стрелочками, и пытаются как-то в этих схемах отразить то или иное содержание психики или сознания. Такие методы изобретались многими исследователями по мере надобности по меньшей мере с 1970-х годов. (Новак Joseph D. Novak, концепт-карты; Аксельрод R. Axelrod, когнитивные карты; исходно Э. Толмэн: «Когнитивные карты у крыс и человека», 1948). Прообраз семантических сетей придуман Ч. Пирсом в 1909, затем ими много занимались, моделируя память человека и внося разработки в компьютер (Р. Риченс 1953; Дж. Андерсон 1973; Д. Норман 1975) для разработки машинного перевода.

Использовались в учебном процессе, применялись в документообороте, при планировании организационных процессов, в создании должностных инструкций, при описании психологических процессов, при обсуждении логики мышления, при решении семантических проблем. Говорят также о картах знаний, семантических картах, картах памяти.

Существуют многочисленные программы для построения таких карт. В целом надо сказать, что это всё программы для построения квадратиков со стрелочками. Они очень полезны для автоматизации отлаженного метода построения карт – когда понятно, что будет написано в квадратиках и откуда это написанное возьмется – и когда таких карт нужно много и очень красивых.

Однако сущностным ядром метода является не то, как нарисовать блок-схему, а формализация – бережная, по возможности без искажений – информации, содержащейся в живых разговорах людей, выражающей их мнения по разным вопросам. Поэтому важно понимать, что это не применение уже готового метода (потому что уже есть когнитивные карты и схемы концептов) к новому материалу, а разработка принципиально нового метода, пользующегося старой наработанной символической базой.

Поэтому при изложении метода наибольшее внимание будет уделено содержательным операциям по объективации и формализации высказываний респондентов. Более тривиальные моменты изложены кратко (способы использования машин поиска по блогам; программы представления данных в виде блок-схем; разработка легенды для схем).

4. Новый наряд Гутенберга: устная письменная речь
В исследованиях разговоров людей мы имеем дело с новым явлением, которое возникло 10-15 лет назад, не более. Разговор в интернете – это очень специфическая культурная реалия (при том, что чрезвычайно распространенная). Это новая и неустоявшаяся граница между приватностью и публичностью. Это разговор двоих или троих на ярко освещенной сцене перед совершенно темным зрительским залом – а в зале может никого не быть, а может быть несколько тысяч человек, которые внимательно слушают каждую реплику и следят за поведением говорящих. Это внепространственость – говорить могут люди из ЮАР, Москвы и Канберры – в одном разговоре. Это чрезвычайная разнесенность во времени. Иногда разговор заканчивается, а через пять лет приходит человек, обращается с вопросами к говорившим – и ему отвечают, разговор продолжается с паузой в пять лет. Это разговор на новом виде, новом формате языка – т.н. «устная письменная» речь, использующая как устные обороты, так и очень изощренные литературные конструкции. Это разговор, подкрепленный огромным количеством глубоких примеров – даваемых ссылками, которые требуют многих часов для своего изучения. В общем, это совершенно новая реалия в культуре, и именно в этой новой среде, еще не устоявшейся и ищущей новые формы, происходит огромное количество разговоров и складывается общественное мнение. Для справки – аудитории многих блогов перекрывают тиражи средних областных газет, аудитории покрывают людей из десятков стран, в блогах присутствуют журналисты и политики, многие солидные СМИ активно перепечатывают то, что говорится в блогах, там происходит «заваривание» компаний протеста, люди сговариваются о месте проведения акций, обсуждают их тактику, спорят об идейных составляющих. При этом число участников разговора не определено – их нельзя посчитать. Они принципиально анонимны – хотя о некоторых можно выяснить всё вплоть до номера паспорта. Множество людей, говорящих в сети – сотни тысяч и миллионы – не имеют социально-демографических характеристик, эта среда общения не позволяет знать – в социологическом смысле – кто говорит, но очень легко дает узнать – что говорит.

5. Стадии проведения работы по методу картирования концептов

5.1. Определение предмета исследования и формулирование гипотез
5.1.1. Определение темы исследования и предмета
Выделение интересующих концептов, их связей, формулировка темы, проблем исследования и его задач. На этом этапе требуется представить образ результата и, исходя из него, решить, какие ключевые слова, какие концепты должны быть предметом данного исследования. То, как тема исследования формулируется исследователем-специалистом, обычно непригодно для работы, это специальная терминология. Поэтому надо выдвинуть ряд гипотез о том, как данная тема обсуждается в разговорах людьми.

5.1.2. Соотнесение предмета с доступным материалом: привязка на местности

Гипотезы о том, какие словоформы могут их представлять в речи респондентов, с чем могут быть связаны эти словоформы, гипотеза об ассоциированных концептах и т.п. Как эти словоформы соотносятся с темой исследования, какие поправки сделаны, чтобы выбрать эти словоформы.
Определение области исследования – интересующей совокупности разговоров, их сроков, локалитета, тематических привязок и т.п.
Эти задачи могут решаться очень разным образом. Например, могут привлекаться эксперты по данной области знания, могу проводиться фокусированные интервью с экспертами-специалистами. Можно обращаться к профильным исследованиям и переворачивать научную литературу. Все формы научного поиска возможны, на выходе неопределенный интерес к чему-то этакому, что сопровождается движениями пальцев, должен быть заменен четкой формулировкой гипотезы, представлением о тех словах, которые мы будем искать, и четким указанием связи этих поисковых слов с исходной гипотезой.

5.2. Проведение поиска с использованием словоформ как ключевых слов
5.2.1. Материал и генеральная совокупность
Использован поиск Яндекса по блогам, http://blogs.yandex.ru/ Этот механизм сканирует все «диалоговые ресурсы» – блоги, форумы и т.п. Тем самым выбран не какой-то один большой блог, поиск производится по всем ресурсам русского интернета, которые механизмом Яндекса опознаны как блоги. Метод выбора ресурсов для подключения к этой службе Яндекса – механизм не вполне прозрачный (комммерческая тайна), часть ресурсов вносится сотрудниками Яндекса, часть подают заявки на участие и подключаются после рассмотрения заявки. Но лучшего механизма поиска по русскоязычным блогам не существует, и потому логично использовать именно этот инструмент.
Сейчас произошло сращивание интернет-СМИ и блогов. То есть нет возможности различить разговоры частных людей и статьи в журналах, газетах и т.п. Причина: в медиа обширно цитируются тексты блогов; блоггеры пишут статьи в медиа; многие блоггеры являются журналистами, которые вывешивают в своих блогах полные версии своих статей; многие издания завели блоги, куда транслируют статьи газеты; многие издания сделали возможность комментировать помещаемые статьи; в блогах часто цитируются статьи СМИ с комментариями данного блоггера, выражающего согласие или несогласие. В результате фрагмент текста, содержащий ключевое слово, может встретиться в перепечатке из медийной статьи и даже из книги, цитированной в блоге.
Для разных концептов различна доля «партикулярности» и «медийности» цитат. Некоторые слова используются в обыденной речи, в разговорах, и сравнительно редко встречаются в медийной речи – в таких случаях поиск по блогам дает преимущественно указания на разговоры «частных» блоггеров.

С помощью поисковых машин (yandex, google) операционально задается вся генеральная совокупность того материала, в котором мы ищем. Определять все источники, где в сети идут какие-либо разговоры и спорить, включать ли в них чаты, или Твиттер и т.п. – не продуктивно. Область поиска определяется операционально: ищем там, где ищет поисковая машина Яндекс.Блоги и разговорами считается то, что этот робот выдает в качестве результата. Всё, что включено в выдачу робота, относится к ответу. Тем самым элиминируется субъективный момент отбора данных. В выдачу попадают статьи медиа, строки твиттера, рекламные объявления, спам, научные работы, и – конечно – множество разговоров и записей в блогах.

5.2.2. Получение материала
В строку поиска вставляются слова, выбранные в п.1. Задаются параметры поиска. Поисковая машина выдает совокупность ссылок, которая и является первичным материалом работы.
Это очень важный этап, его значение можно понять так: задается «метрика» исследования. Поисковый робот выдает совокупность коротких текстов, включающих ключевые слова. Именно на этом этапе мы переходим к работе с текстами и можем начать группировать высказывания. Выдача поискового робота структурирует материал, создавая основу для построения семантической сети. У нас благодаря работе робота производится дискретизация и выделение объектов исследования, которые являются элементами семантической сети.

Задание такой «метрики» для семантической сети, в рамках которой потом производится всё более детальная классификация, позволяет нам не вводить семантическую сеть внешним образом, позволяет использовать естественные языковые структуры.

5.3. Фильтры и выделение границ текстов
5.3.1. Фильтры по семантике и прагматике
Весь результат выдачи поискового робота преобразуется в текстовую форму. Мы получаем очень большой текст. На некоторые запросы можно получить сотни тысяч ссылок-ответов, по каждой ссылке – текст, длина которого не ограничена. Тем самым в пределе мы получаем миллионы страниц текста после поиска по интересующим нас словам. Или, например, не получаем никакого ответа; или получаем всего две-три бедных ссылки.
Уже из ответа поискового робота можно убрать многие ссылки. Фильтры накладываются самые разные – они зависят от полученного материала и цели исследования. Например, можно не принимать во внимание рекламу и спам. Или не учитывать перепечатки статей из медиа, которые часто встречаются в блогах. Или поставить стилевые ограничения.
Самым применяемым видом фильтрации будет отбор текстов по смыслу. Каждая словоформа обладает многими смыслами. Например, «перестройка» может упоминаться в связи с ремонтом квартиры, изменением документооборота в фирме, реставрации старинного дворца и как обозначение периода времени в истории России. Из всего материала, принесенного поисковым роботом, отбирают потенциально пригодный для решаемой задачи, отфильтровывая побочные смыслы, синонимы и т.п.

5.3.2. Уплощение гипертекста
Чтобы перейти от гипертекста – ссылок, ведущих к страницам с текстом, на которых также стоят различные ссылки – к простому тексту, надо провести следующую стадию редукции материала.
Получив в предыдущем пункте «ссылки по теме», раскрываем каждую ссылку и определяем границы цитаты, интересующей нас в связи с заданной темой.
Это чрезвычайно важная часть методики, поскольку именно здесь определяется, каким будет текст, с которым будут проводиться следующие операции. Для выделения нужного текста-цитаты из всего текста на страницы – страница прочитывается и из нее выбирается фрагмент текста (по возможности, целостный), где говорится именно о том, что интересует в данном исследовании.
Тем самым мы по каждой ссылке встречаемся с большим текстом (размер не ограничен; это может быть 200 знаков, 3000 и 15000 или больше) и вырезаем из него цитату по теме, ориентируясь на интересующие нас словоформы (принятые в начале исследования по определённым соображениям и оформленным в гипотезу).
Теперь мы из сотен ссылок в сети (или тысяч) имеем сотни (…) текстов-цитат. У нас получилось собрание текстов в виде текстового файла, каждая цитата сопровождается адресом ссылки, чтобы при необходимости вернуться на страницу источника в сети и изменить границы текста, проверить его адресность, определить какие-то характеристики автора и т.д.

5.4. Гипотезы о структуре: анализ текста для выявления концептов и их связей
Цель данного этапа - создание промежуточных гипотез о тех структурах, которые следует искать в совокупности текстов.
Структуры могут быть очень различны. Например, может оказаться, что интересующим ответом будет совокупность определений предложенного понятия. Или – набор характеристик, прилагательных, эпитетов. В этом случае исследуемому концепту ставится в соответствие набор слов, которые его как-то описывают и характеризуют.
Более интересный результат получается, если обнаруживаются не просто односложные характеристики, а специфические связи с другими концептами – оппозиции, альтернативы, синонимы, прочные связи следования, участки дедукции, устойчивый перенос внимания с одного понятия на другое. Такие сложные связи концептов образуют некий рисунок разговора, структуру текста. Могут быть замечены стереотипы и клише, или, напротив, оригинальные способы рассуждения.
При просмотре всей совокупности полученных на этапе 3 текстов возникает ряд гипотез о структурах, которые следует в этих текстах искать и выделять.

5.5. Выделение наборов элементарных структур
Если гипотеза о «продуктивных» для данной задачи структурах оказалась верной, на этой стадии можно получить множество «элементов» - минимальных концептов со связями. Скажем, набор характеристик некого объекта, явления или персонажа. Гипотезы о причинах некого события. Представления о следствиях какого-то явления. Логику принятия решения в некой ситуации. Аргументацию в идеологическом споре. Можно получить множество элементарных концептов со связями.
При этом на одной и той же совокупности текстов могут находиться несколько видов структур. Возможно, по одним и тем же текстам удастся найти характеристики персонажа (к примеру, политика); аргументы в пользу определенных решений; описание сопутствующих обстоятельств; критику принятых решений и обоснования критики. Это будут разные аспекты, относящиеся к одной теме, это будут разные детали в том смысловом поле, которое нас интересует для решения задачи.
По окончании этого этапа весь объем текста, состоящий из множества текстов-цитат, размечен на элементы и типы связей.

5.6. Создание «архетипа», или «обобщенной карты»

5.6.1. Выделение общего и различий
Для соединения элементов в нечто единое следует снова просмотреть всю совокупность текстов – и отбросить редкие варианты, то, что не повторяется, а также специально подчеркнуть, выделить то, что повторяется – фигуры речи, эпитеты, применяемые концепты, формы связей.
Понятно, что каких-либо «семантических элементов» из текста можно нарезать неопределенно много. Поэтому тут надо напомнить: у нас имеется тема исследования, есть гипотеза в виде того понятия, через которое мы искали, у нас есть богатая структура ожиданий, что именно может быть и с чем может быть связано данное понятие. Поэтому из указанных текстов выделяются не «все» семантические элементы (это невозможно, их число неопределенно и, можно сказать, бесконечно), а только те, которые интересуют в связи с темой и задачей исследования. По опыту можно сказать, что этих элементов обыкновенно не хватает, а вовсе не избыток.

5.6.2. Построение обобщенной карты
Затем, учитывая различающие элементы и убирая редкие, можно построить обобщенную схему. Найденные элементы совмещаются, накладываются друг на друга, и образуют сеть понятий, соединенных специфическими связями. Это происходит в несколько этапов: идет классификация использованных словоформ, просмотр контекстов употребления, понимание смысла, в котором они употребляются и на этой основе сведение их, синонимизирование – не в общем случае, не словарная синонимизация, а в конкретном. Понятно, что в некотором разговоре слово «жопа» может быть полным синонимом выражения «дела со здравоохранением в области обстоят неважно».
Происходит выделение отдельных элементов и их смыслов; их синонимизация через использование критериев гомологии; образование общих кластеров смыслов – каждый может быть обозначен как некий графический элемент, квадратик со словом (использованным респондентом), но ему соответствует целая группа слов, которые классифицированы так же, как данное слово. Благодаря использованию критериев гомологии из частей-концептов строится общий архетип – аналог картины мира в приложении к интересующей цели, к поставленной задаче.
В результате могут получиться довольно сложные структуры. Например, карта концепта «демократия» показывает на положительную ценность (демократия), которая окружена путями, имеющих обычно отрицательную окраску.
Все способы разговаривать о демократии, все движения смыслов от этой темы блокированы отрицательными оценками, ведут в очень неприятные области и в конечном счете сваливаются в общий смысл «диктатура».
Так что поверхность, которую создает карта концептов, может выглядеть довольно сложно

5.6.3. Противоречия как элемент общей картины
Все споры происходят в рамках общей картины мира, между разными картины мира споров нет.
Важно заметить, что одна обобщенная схема включает мнения спорящих между собой, непримиримых респондентов. Они по-разному оценивают явления; они не согласны относительно следствий или причин – это не выводит их из общей плоскости единого мировоззрения. Их разногласия будут отображаться как разные связи у центрального понятия, как несколько видов следствий от единой причины, как несколько возможных причин у единственного следствия, как оппозиция в оценке. Все многообразие мнений по некому поводу изображается в рамках одной схемы. Основанием для этого является, конечно, единство мира и языка.
Пока респонденты говорят «об одном и том же» – сколь угодно различно его оценивая, ставя в разный контекст и т.п. – они появляются вместе на одной карте концептов. Карта включает разные мнения, борющиеся идеологии и альтернативные объяснения как дороги. Люди разными путями объясняют себе нечто, понимают это разными способами – но это только разные дороги в общем поле понятий.
На карте концепта «демократия» видно, что люди могут говорить на эту тему совершенно различным образом и спорить с разных позиций – все вместе их разговоры укладываются в общую схему.
В результате получена карта взаимоотношений концептов, включающая в себя не какое-то единственное мнение, а именно множество мнений. Сам способ ее построения (выделение общих концептов и их связей) делает ее не частным результатом вроде «экспертного мнения», а именно формой представления общественного мнения.
На карте концептов «элита» видно, что по отношению к этому концепту существуют противоречия (обозначены двунаправленной стрелкой), респонденты дают принципиально разные картины возникновения элиты в 90-е, и тем не менее это – элементы одной общей схемы.

Однако возникают вопросы – насколько эта карта достоверна? Как можно ее проверить? Чье мнение она представляет и на кого можно распространять полученные результаты?

Читать полную новость с источника 

Комментарии (0)