Первичная обработка текстовой информации в бизнес-разведке

рис.

Автор: Нежданов Игорь Юрьевич

Точная фиксация сообщения (в т.ч. и система архивирования)
Прежде чем начать анализ информации, необходимо эту самую информацию получить и каким то образом сохранить. При этом нельзя забывать и о том, что на информацию накладывают отпечаток и сам источник, и канал передачи, и получатель информации, и особенности ее хранения. Поэтому крайне важно сделать так, чтобы при всех действиях до попадания к аналитику информация ни коим образом не подвергалась изменениям, пусть даже незначительным. В том числе и на этапе поступления к вам, хранения и извлечения из хранилища.
Иными словами, поступившая к вам информация должна быть зафиксирована и сохранена в том виде, в каком она поступила. При этом должны быть зафиксированы и атрибуты информации. Знание атрибутов информации понадобится для проверки достоверности информации, для понимания мотивов генерации информации и передачи вам, и для понимания тенденций в развитии ситуации. Далее с информацией можно работать, интерпретировать, сравнивать, стыковать, но исходный материал все так же должен быть неизменен.
Архивирование ни что иное как сохранение полученных данных. Архивирование, безусловно, нужно осуществлять таким образом, чтобы можно было быстро найти нужные данные. Удобнее всего это делать в СУБД, но не всякая программа управления для этого подходит. Качественное проведение данного этапа позволит в последствии делать обоснованные выводы об авторе, о редакции, об издательстве и т.п.
Фиксация атрибутов сообщения
Для оценки информации и дальнейшей работы с ней необходимо понимать когда, от кого и как эта информация поступила. А это ни что иное как атрибуты информации. Таковых атрибутов, характеризующих информацию по разным признакам может быть очень много, но есть ряд из них, которые необходимы всегда.
Предположим вы создаете базу данных на основе публикаций из периодики. Попробуйте назвать необходимые атрибуты информации.
Предлагаю следующий перечень:
- источник;
- название;
- автор;
- дата поступления;
- дата публикации (обнародования);
- канал поступления;
- тип сообщения.
Возможны и иные (специфические) атрибуты, необходимые для решения тех или иных задач. Например:
- на каком носителе поступила информация;
- в какое время поступила информация (а не только дата);
- когда была внесена в архив;
- кто принимал информацию;
- заказная или редакционная (для статей);
- если заказная – кто заказчик;
- на какую аудиторию ориентирована (для СМИ);
- для кого выгодна;
- и т.п.
Попробуйте в приведенном ниже тексте выявить основные атрибуты информации.

Новости компаний
На состоявшемся 15 мая общем годовом собрании акционеров ОАО "Южноуральский арматурно-изоляторный завод" (ЮАИЗ) акционеры утвердили дивиденды за 2001 год по привилегированным акциям в размере 5 рублей на одну акцию номиналом 0, 5 рубля, или 1000% годовых. Дивиденды на обыкновенные акции решено не начислять.
В собрании приняли участие акционеры, владеющие в совокупности более 93, 9% голосующих акций и внесенные в реестр по состоянию на 1 апреля этого года.
Председателем совета директоров акционерами был переизбран депутат Законодательного собрания Свердловской области Петр Иванов. В завершении собрания акционеров выступил председатель совета директоров ЮАИЗ Петр Иванов. В своем выступлении господин Иванов отметил огромное значение завода не только для уральского региона, но и для России.
21.05.2002
автор Николай Угольников
Газета Деловой Урал

Должно получиться следующее:
- источник - Газета Деловой Урал;
- автор - Николай Угольников;
- название – Новости компаний;
- дата поступления - неизвестна;
- дата публикации - 21.05.2002;
- канал поступления - неизвестен;
- тип сообщения - статья

Попробуйте взять несколько разноплановых информационных блоков и определите их атрибуты. Заведите себе правило – перед изучением любой информации определять ее атрибуты. Именно так поступают прожженные бюрократы – попавший к ним документ они изучают по следующей схеме:
- кто автор;
- кто подписал;
- когда подписал;
- чьи визы наложены;
а уж затем внимание переходит на содержимое документа. В первую очередь изучаются атрибуты документа. Спрашивается почему? Все очень просто – по атрибутам легко определяется ценность (важность) данного документа для данного бюрократа. И на основании этого делается вывод о необходимости реагирования на него, а то и вовсе прочтения.
Выявление дополнительных данных (по возможности)

Когда вы получили какое то сообщение, обычно возникают дополнительные вопросы, связанные с содержанием сообщения. Например упоминание неизвестного объекта, события, свойств или еще чего то. В таких случаях необходимо (по возможности конечно) задать дополнительные вопросы и как то прокомментировать поступившие сведения. Этот комментарий становится дополнительным атрибутом информации, но исходный текст сообщения должен остаться неизменным. Такой комментарий имеет два направления:
- выяснение дополнительной информации у источника;
- получение дополнительной информации у иных источников.
Возьмите приведенную выше статью и выявите непонятные вам моменты, а также сформулируйте вопросы. Представьте, что вы изучаете ситуацию на рынке изоляторов, а данная статья является вашим первым информационным блоком. Выявляя непонятные моменты опирайтесь на собственный опыт – то что вам лично не понятно.
Примерный перечень возможных вопросов:
- что представляет из себя ЮАИЗ, каково его положение на рынке, кто владелец?
- какие выплаты дивидендов были в прошлые периоды?
- кто такой Петр Иванов?
И т.д. и т.п..
Далее определите где можно получить информацию по составленным вами вопросам. Кто может рассказать об интересующей вас ситуации. Если есть такая возможность, эти вопросы можно адресовать автору статьи или кому то из руководителей данного издания. Если такой возможности нет – нужно воспользоваться услугами экспертов в данной области и ресурсами открытых источников, в т.ч. и интернета.

изложение без искажений или вычерпывание смысла
Достаточно важным в работе с текстами является умение передавать смысл сообщения без искажений, понимать что написал автор и что он хотел сказать. Если у вас есть возможность передать точную копию текста – отлично – так и нужно поступить. Но чаще бывает так, что нужно сжать содержимое нескольких страниц в несколько фраз или запомнить их содержимое, а ведь далеко не все обладают столь феноменальной памятью.
В этом случае на помощь приходит методика понимания содержимого. Это ни что иное как выявление из текста неоспоримых фактов; выдвижение гипотез, которые могут подтверждаться наличием опор в тексте; и предположения по поводу невозможного также имеющего опоры в тексте.
Упрощая смысл сказанного видим, что получатель информации должен обосновывать свое мнение (гипотезу) только посредством имеющихся в тексте сигналов (опор) или попросту не выходить в своих суждениях за границы очерченные текстом – не интерпретировать.
Например вы услышали часть разговора – всего одну реплику. Что можно сказать опираясь на эту реплику?
- по голосу – пол говорившего,
- возможно его возраст и настроение,
- возможно чем вызван разговор
- и с большой долей вероятности о чем шла речь…
Главное чтобы все ваши выводы были обоснованы, т.е. имели опору в услышанном. Нельзя ни на чем не основываясь заявить например что говоривший не местный – если вы это утверждаете, значит отметили особенность выговора (акцент) если особенность акцента не замечена – никаких гипотез и тем более выводов.
Попробуйте поработать с предложенным выше текстом (Новости компаний) ответив на приведенные вопросы:
В чьих интересах написана статья?
Основные объекты (фигуранты) или о ком (о чем) публикация?
О чем публикация?
Отношение автора к объекту, событию или проблеме
Попробуйте выбрать опорные сигналы:
-штампы
-несуществующие слова
-экзотическое
-профессиональный слэнг
-научный лексикон
-уличный слэнг
-ранее используемое образование (цитата)

Таким образом удобно изучать прямую речь (запись разговора, выступления, интервью и т.п.). Примерно также изучаются и любой текст. С той лишь разницей, что в текстах нужно использовать еще и иные сигналы - сигналы лингвистические. Для упрощения понимания нужно немного отвлечься. Рассматривайте изучаемый текст не как произведение чьего то творчества, а как простой набор символов. При таком подходе к сигналам можно отнести:
- значение отдельных слов;
- особенности соединения слов (словосочетаний и словообразований);
- порядок расстановки слов;
- знаки препинания.
Любые другие сигналы – это проявление личности читающего, а никак не исследуемый текст.

Варианты сигналов:
1 значения отдельных слов:
- собственно значение слова (например в соответствии со словарем Ожегова)
- вид слова (штамп, несуществующее слово, книжное, экзотическое)
- лексическая принадлежность (проф слэнг, научный лексикон, уличный слэнг…)

2 соединение слов:
- ранее используемое образование (цитата)
- нормальное сочетание слов или необычное
- рифмованное или нет

3 порядок слов:
- правильный синтаксис (порядок слов) – как в учебнике
- неправильный (здесь важно понять эту особенность – неправильность)

4 знаки препинания:
- наличие пауз
- обращение внимания на слово, словосочетание или фразу
- незаконченность
Важно вначале увидеть этот сигнал, а затем его понять. Помните – любое сообщение состоит из следующих элементов: автор создавший сообщение, предмет о котором сообщение, лицо которому адресовано сообщение, текст сообщения и вы – тот кто анализирует сообщение. И только проработка всех этих элементов позволит качественно изучить полученные данные.
Оценка информации
Критерии оценки информации (важность, точность, значимость)

По каждому эпизоду (текстовому блоку, сообщению и т.п.) необходимо принять решение о нужности , хранении и дальнейшем использовании. Собирать всю окружающую информацию прямо скажем весьма затруднительно – для этого требуются колоссальные ресурсы. Даже для государств это непростая задача.
Сам процесс выбраковки должен иметь четкие критерии. Для принятия решения о принятии и дальнейшем хранении информации осуществляется первичная ее оценка. Критерии первичной оценки должны быть немного загрублены для исключения потери важной информации, но незначительно – иначе поток превратиться в неконтролируемый.
Выше мы обсудили свойства информации, которые по своей сути и есть критерии ее оценки:
Объективность – субъективность
Достоверность – недостоверность
Полнота – неполнота
Актуальность – неактуальность
Ценность – бесполезность
Понятность - непонятность
Поскольку в наш информационный век поток информации ( в т.ч. и потенциально полезной) достаточно велик, необходимо принимать меры для ускорения процесса ее обработки. Часто, для ускорения процесса оценки информации используют упрощенный набор критериев.
Этап оценки информации включает в себя:
- изучение содержания полученной информации с точки зрения выбранных свойств (достоверность, объективность, полнота и т.д.);
- определение необходимости дальнейшей проработки (сбор дополнительных сведений).
Не забывайте, что оценочный этап работы с информацией должен быть максимально сокращен для сведения к минимуму эффекта старения информации.

Критерии упрощенной оценки информации
РЕЛЕВАНТНОСТЬ информации – наличие связи с проблемой (соответствие нашим интересам) и способность информации внести вклад в процесс понимания проблемы. Другими словами это ценность информации. Для принятия решения по релевантности необходимо сопоставить данную информацию с вашими информационными потребностями и ответить на вопрос сможет ли помочь она вам чем-то сейчас или в ближайшем будущем? Если да – переходите к следующему этапу, если нет – в корзину (если только она вам не пригодится в другом деле…).
ДОСТОВЕРНОСТЬ информации свойство синтетическое - оно объединяет в себе объективность и достоверность. Она (достоверность) информации определяется по следующим параметрам:
- наличие подтверждения из других источников
- стыкование с другой информацией
- знание источника и его мотивов
- авторитет или длительная положительная история работы с источником
- свойства канала передачи информации
Как видно важнейшее место здесь занимает знание об источнике информации.
ЗНАЧИМОСТЬ информации:
- понимание самой информации,
- полнота освещения предмета интереса,
- своевременность информации и ее достаточность для принятия решения.
Попробуйте оценить предложенную выше статью. Проблема, которая перед нами стоит, звучит так: «Состояние черной металлургии в РФ».

В процессе работы с информацией (на любом этапе) возможно возникновение ситуации, когда для понимания происходящего не хватает данных. В этом случае можно воспользоваться приемом восстановления информации.
Суть его в том, что любому событию что-то предшествует, какая то подготовка, какие то события и везде остается след. Какие то процессы сопутствуют основному событию, что то становится следствием этого события. Нужно уметь восстанавливать последовательность событий и выявлять места, где может остаться информация о событии. Все мы живем в социуме и по тому любое более или менее значимое событие оставляет след не только в нашей памяти, но и в памяти многих людей нас окружающих. Например мы регистрируем новое юридическое лицо. Информация об этом остается у нас, у тех, кто готовил документы, в местном регистрирующем органе (в базе данных, у специалиста принимавшего документы, у специалиста выдававшего свидетельство), в банке, где открыт счет, в пенсионном фонде и фонде социального страхования. И это только поверхностный осмотр. Другой пример – мы продали недвижимость. Среди носителей информации о данном факте и риелтор , проводивший сделку, и БТИ (а в нем бог знает сколько сотрудников), и ЖЭК, и местный орган энергоконтроля. В общем сделать что то не оставив следов весьма проблематично. И в ситуации недостатка информации важно понять как должны были происходить изучаемые события и где должен остаться след. А дальше нужно найти способ этот след получить.
Установление источника, получателя, их пространственных и временных координат.
Данный шаг выполняется в рамках первичной оценки информации при условии достаточности сил и средств и особенно актуально для сообщений СМИ и слухов. Его результатом может стать понимание важности информации внешне никак не связанной с объектом интереса. Если источник информации, получатель и их пространственные и временные координаты нельзя прямо установить из содержания, то используются следующие приемы:
– для установления источника:
определение специфики лексикона источника:
- анализ распределения служебных терминов
- определение частоты употребления слов и сопоставление с аналогичными показателями известных источников
- сопоставление с аналогичными характеристиками профессиональных, социальных, этнических и т.п. групп.

Ценный результат дает сопоставление статистического анализа с:
- профессиональными эталонами - для определения профессиональной принадлежности
- образовательными эталонами – для установления уровня образования
- авторскими эталонами (статьи СМИ) – для определения авторства, для определения того, что статья писалась под диктовку, для определения подложного авторства

- для установления временного интервала:
исследуются все имеющиеся в сообщении указания на его принадлежность к некоторому временному интервалу, отраженному в ссылках на те события, даты которых известны или могут быть установлены.

- для установления получателя:
кому может быть интересна данная информация, кто читает данный источник (если это СМИ) и т.д.

На основании собранных данных каждой вновь поступающей порции сведений присваиваются дополнительные атрибуты (см «Фиксация атрибутов сообщения»):
- кто или что является первоначальным источником информации (или другими словами абсолютный источник данной информации);
- кто предал огласке информацию (СМИ, автор);
- когда впервые информация предана огласке (задержка обнародования от времени события);
- когда опубликована полученная вами информация;
- статус публикации (редакционная или оплаченная (рекламная) и т.п. если оплаченная то кем);
- кому выгодна а кому нет и почему;
- однотипные публикации в других СМИ.

Также собирается комментирующая информация:
- другие высказывания или публикации того-же автора (издания, темы, оценка);
- соавторы и оппоненты по другим выступлениям (если есть);
- другие публикации в данном СМИ на заданную и близкие темы (авторы, цель, содержание, эмоциональная окраска, оценка);
- общее отношение автора и источника к данной теме;
- публикации, сходные по цели, смыслу, содержанию (СМИ, авторы);
- реакции на публикацию их источники, содержание, эмоциональная окраска (комментарии, контрвыпады, критика и т.п.).

Установление фактографической составляющей текста, его тематики.
Данный шаг так же необходим для понимания корреляции полученной информации с тематикой исследования, а по тому выполняется в рамках настоящего этапа.
В начале из текста выделяют:
- компоненты, которые могут быть отнесены к разряду фактов (например подтверждены иными источниками);
- компоненты, которые потенциально могут быть отнесены к разряду фактов;
- компоненты, которые не могут быть отнесены к разряду фактов.
Соответственно выявляются направления для дополнительного исследования и направления, на которые не стоит тратить силы.
Далее определяется каким образом можно подтвердить или опровергнуть потенциальные факты.
При этом нельзя забывать об искажениях, вносимых в текст:
- непреднамеренные логические ошибки;
- некорректное построение грамматических конструкций;
- преднамеренное искажение;
- эмоциональные искажения.
Поэтому важно выявить в тексте наличие причинно-следственных связей.

Пример
«Вячеслав Иванов, председатель общества Изучения НЛО, обратился к Президенту РФ В.В. Путину с просьбой предоставить для изучения имеющиеся у военного ведомства материалы о так называемых «квакерах» аномалиях, неоднократно зафиксированных в мировом океане Российскими подводниками»

Что можно отнести к фактам?
- ВВ Путин – президент РФ
Что потенциально может быть фактом (после проверки)?
- В Иванов – председатель общества Изучения НЛО
- то что В Иванов обратился с соответствующей просьбой
- существование аномалии под названием Квакер
- наличие информации о Квакерах у военного ведомства
Что мы не можем отнести к фактам в т.ч. потенциальным?
Как проверить потенциальные факты? – где можно получить подтверждающую или опровергающую информацию?

Теперь попробуйте самостоятельно поработать с предложенным ранее текстом (Новости компаний). Выберете явные факты, потенциальные факты и не фактов. И предложите пути проверки.

Также анализируется полнота и непротиворечивость аргументации. Вначале текст нужно привести в формализованный вид. Иными словами его нужно пересказать сухим языком, удалив любые образования и надстройки (эмоциональные, психологические, рекламно-пропагандистские, ненормативная лексика, слэнг и т.п.). Очень похоже на резюмирование. У вас получится перечень аргументов (утверждений). Далее выявляются искажения (отсутствие аргументации, ложная аргументация, неполная аргументация и т.п.).

Пример
«Недавно, после необъяснимых событий в Северной Атлантике, приведших к неоправданным человеческим жертвам, Вячеслав Иванов, председатель общества Изучения НЛО, направил Президенту РФ В.В. Путину письмо с требованием незамедлительно предоставить для изучения имеющиеся у военного ведомства материалы о так называемых «квакерах» аномалиях, неоднократно зафиксированных в мировом океане Российскими подводниками. В данном послании, в частности говорится, что замалчивание данных фактов является одной из основных причин гибели людей и вся ответственность за это лежит на военных и на президенте России.»

Попробуем формализовать сообщение. Должно получиться следующее:
- в Северной Атлантике произошел инцидент с гибелью людей;
- В Иванов – председатель общества изучения НЛО – направил Президенту РФ письмо
- в письме присутствует требование предоставить информацию и обвинение военного ведомства и Президента в замалчивании информации и в гибели людей
Что я упустил?
- наличие у военных информации об аномалии под названием Квакеры
- связь Квакеров с подводниками
- связь Квакеров с инцидентом в Северной Атлантике
Теперь попробуйте формализовать таким же образом текст статьи (Новости компании).
Далее проверяется аргументация. В приведенном примере с Обществом изучения НЛО аргументации нет. А есть попытка на эмоциональном уровне очернить руководство страны и Министерство Обороны.
Чтобы сообщение было аргументировано в нем должны присутствовать неопровержимые (или легко проверяемые) факты.
При углубленных или специализированных исследованиях устанавливается эмоциональная составляющая текста и системы оценочных суждений - текст анализируется на наличие слов, терминов, словообразований способных воздействовать на эмоциональное состояние потребителя сообщения. Это позволяет, в сочетании с анализом специфики лексики источника, выявить систему ценностей источника и определить поведенческие особенности этого источника. Второй составляющей данного этапа является фильтрация оценочных суждений источника.
Помимо этого устанавливается цель генерации текста. Данный этап возможен если установлен потребитель текста (по аудитории того СМИ, которое его опубликовало). Тогда анализируется модель окружающего мира потребителя (в части содержимого сообщения) и сравнивается с предлагаемой моделью в тексте сообщения. По моделью окружающего мира подразумевается представление этого самого мира (мироустройства) или его части, - то как человек для себя понимает что происходит вокруг него.
Если модели совпадают или отличаются незначительно – обычное общение. Если модели различаются значительно – источник преследует цель побуждения потребителя к неким действиям. Если в модели окружающего мира потребителя никак не отражена описываемая источником область (потребитель ничего не знает об этом) – налицо формирование модели (представления), а вот с какой целью – в данном случае необходимо разбираться отдельно.

Попробуем разобрать пример с Обществом изучения НЛО. Предположим, что сообщение было опубликовано в газете «НЛО». Основная аудитория – обыватели не имеющие высшего образования, работающие исполнителями, в возрасте от 20 до 30 лет.
Их ключевые представления (модель мира):
- правительство заботится только о собственном кармане
- все предприниматели сволочи, а всем руководителям наплевать на подчиненных
- мы никому не нужны
- главное выжить в данный момент
В приведенном тексте предлагается следующая модель мира:
- руководству страны безразлична судьба моряков
А параллельно внедрено несколько сообщений:
- В Иванов проявляет заботу о моряках
- В Иванов не боится самого Президента
А теперь скажите – какова цель генерации текста?
- показать наличие организации борющейся за права обездоленных
- показать В Иванова как лидера в данной борьбе
- заявить о себе, привлечь внимание к себе через привлечение внимания к ситуации
- популяризировать деятельность Общества изучения НЛО.
Теперь попробуйте проделать то же самое с тестом о Южноуральском Арматурно-изоляторном заводе (Установление цели генерации текста).

Оценка личностной составляющей сведений
Параллельно происходит и оценка личностной составляющей сведений. Первое направление это оценка сведений вне контекста. В этом направлении изучаются психологическая и логическая составляющая сообщения:
- эмоциональная напряженность и окраска текста;
- стиль сообщения;
- совпадение стиля с другими текстами того-же автора;
- заимствования (и естественно откуда);
- внутренняя непротиворечивость сведений;
- непротиворечивость сведений по отношению к известными данными.
Приведенный метод достаточно обширен и требует определенного времени и опыта. При недостатке ресурсов использовать его следует эпизодически – по отношению к конкретным проектам, а в некоторых ситуациях к конкретным группам сообщений.
Второе направление оценки сведений это понимание их значимости, но в отличии первичной оценки более глубокое. В ходе такой оценки необходимо для изучаемого информационного блока (без привязки к остальным) ответить на следующие вопросы:
- как ЭТО может повлиять на наши интересы?
- как можно нейтрализовать негативное влияние?
- как можно использовать это в наших интересах?
Отвечая на данные вопросы необходимо руководствоваться достаточной разумностью – не впадать в беспредметное фантазирование, но в то же время не сужать искусственно границы рассуждений. Другими словами необходимо определить возможность прямого влияния, косвенного влияния, вероятного влияния. И исследовать каждый сектор.

 

Источник: Сайт Нежданова Игоря Юрьевича

Удаление информации из Интернета. Стирание негатива из Интернета

Создание сайтов для малого бизнеса. Создание сайтов для ИП

 

 

<< Вернуться на главную страницу сайта

Перейти к разделу "Конкурентная разведка на предприятии а также вопросы промышленного шпионажа " >>

Перейти к разделу "Интернет и компьютеры как инструменты конкурентной разведки" >>

Перейти к разделу "Вопросы стратегии и геополитики глазами специалистов разведки. Библиотеки. Полезные ресурсы " >>

Перейти к разделу "Официальная информация о российских предприятиях и гражданах в открытом доступе " >>

Сайт Нежданова Игоря Юрьевича "Аналитическая разведка в России"

 

Сайт Невидимый Интернет

 

Сайт Конкурентная разведка и информационная война

Блог Корпоративные блоги

 

 

Открытый мастер-класс Ющука Евгения Леонидовича. Ющук Евгений Леонидович "Конкурентная разведка против PR в живом эфире". В порядке ответа на
"Черный список", автор которого Кузнецов Сергей Валентинович

Блог поддержки открытого мастер-класса Ющука Евгения Леонидовича. Ющук Евгений Леонидович "Конкурентная разведка против PR в живом эфире". В порядке ответа на
"Черный список", автор которого Кузнецов Сергей Валентинович

Пример разработки объекта методами конкурентной разведки: Кузнецов Сергей Валентинович

Результат работы конкурентной разведки по объекту - на примере Кузнецова С.В.: Кузнецов Сергей Валентинович

 

Ющук Евгений Леонидович. Ющук Евгений Леонидович (Ющук Е.Л., Евгений Ющук, Evgeny Yushchuk, Yushchuk Evgeny Leonidovich) Конкурентная разведка для тех, кто работает в российском бизнесе. Конкурентная разведка как продолжение маркетинга.